目次

Search

  1. はじめに
  2. Informatica Big Data Managementの概要
  3. マッピング
  4. ソース
  5. ターゲット
  6. トランスフォーメーション
  7. クラスタワークフロー
  8. プロファイル
  9. 監視
  10. 階層データ処理
  11. 階層データ処理設定
  12. スキーマが変更された階層データの処理
  13. インテリジェント構造モデル
  14. ステートフルコンピューティング
  15. 接続
  16. データ型リファレンス
  17. 関数リファレンス

ユーザーガイド

ユーザーガイド

Spark設定

Spark設定

以下の表に、Sparkエンジンに対して設定する接続プロパティを示します。
プロパティ
説明
Sparkステージングディレクトリ
Sparkエンジンがジョブ実行用の一時ファイルを保存するために使用するディレクトリのHDFSファイルパス。YARNユーザー、データ統合サービスユーザー、およびマッピング偽装ユーザーがこのディレクトリに対する書き込みアクセス許可を持っている必要があります。
Sparkイベントログディレクトリ
オプション。Sparkエンジンがイベントをログ記録するために使用するディレクトリのHDFSファイルパス。
YARNキュー名
クラスタで使用可能なリソースを指定するSparkエンジンによって使用されるYARNスケジューラキュー名。この名前は、大文字と小文字が区別されます。
詳細プロパティ
Sparkエンジンに固有な詳細プロパティのリスト。詳細プロパティには、デフォルトプロパティのリストが含まれます。
Hadoop環境のランタイムプロパティは、データ統合サービス、Hadoop接続、およびマッピングで構成できます。下位レベルで値を設定することにより、上位レベルで構成されたプロパティをオーバーライドできます。例えば、データ統合サービスのカスタムプロパティでプロパティを構成する場合は、Hadoop接続またはマッピングでオーバーライドできます。データ統合サービスは、次の優先順位に基づいてプロパティのオーバーライドを処理します。
  1. infacmd ms runMapping
    -cp
    オプションを指定して設定された、マッピングのカスタムプロパティ
  2. Hadoop環境のマッピングのランタイムプロパティ
  3. ランタイムエンジン用のHadoop接続の詳細プロパティ
  4. Hadoop接続の詳細な全般プロパティ、環境変数、およびクラスパス
  5. データ統合サービスのカスタムプロパティ
Informaticaは、サードパーティが提供するドキュメント、Informaticaが提供するドキュメント、またはInformaticaのグローバルカスタマサポートに問い合わせることなく、これらのプロパティ値を変更することはお勧めしません。プロパティに関する知識がないまま値を変更すると、パフォーマンスの低下やその他の予期しない結果が発生する可能性があります。