目次

Search

  1. はじめに
  2. Informatica Data Engineering Integrationについて
  3. マッピング
  4. マッピングの最適化
  5. ソース
  6. ターゲット
  7. トランスフォーメーション
  8. Pythonトランスフォーメーション
  9. データプレビュー
  10. クラスタワークフロー
  11. プロファイル
  12. 監視
  13. 階層データ処理
  14. 階層データ処理設定
  15. スキーマが変更された階層データの処理
  16. インテリジェント構造モデル
  17. ブロックチェーン
  18. ステートフルコンピューティング
  19. 付録 A: 接続リファレンス
  20. 付録 B: データ型リファレンス
  21. 付録 C: 関数リファレンス

共通プロパティ

共通プロパティ

以下の表に、Hadoop接続に対して設定する共通の接続プロパティを示します。
プロパティ
説明
偽装ユーザー名
HadoopクラスターでKerberos認証を使用する場合に必要です。Hadoop偽装ユーザーHadoop環境でマッピングを実行するためにデータ統合サービスが偽装するユーザー名。
Data Engineering Integrationは、すべてのHadoopディストリビューションのオペレーティングシステムプロファイルをサポートします。Hadoopランタイム環境では、データ統合サービスがHadoopクラスタに処理をプッシュし、ランタイムエンジンがオペレーティングシステムプロファイルで指定されているHadoop偽装プロパティを使用してマッピングを実行します。
一時テーブル圧縮コーデック
圧縮コーデッククラス名のHadoop圧縮ライブラリ。
Sparkエンジンは、一時テーブルの圧縮設定をサポートしていません。Sparkエンジンでマッピングを実行すると、Sparkエンジンは一時テーブルを非圧縮ファイル形式で格納します。
コーデッククラス名
データ圧縮を有効にし、一時ステージングテーブルのパフォーマンスを改善するコーデッククラス名。
Hiveステージングデータベース名
Hiveステージングテーブルの名前空間。指定されたデータベース名を持たないテーブルには、名前として
default
を使用してください。
名前空間を設定しない場合、データ統合サービスはHiveターゲット接続のHiveデータベース名を使用してステージングテーブルを作成します。
ネイティブ環境でマッピングを実行してHiveにデータを書き込む場合、Hive接続のHiveステージングデータベース名を設定する必要があります。データ統合サービスは、Hadoop接続で設定された値を使用します。
環境SQL
Hadoop環境を設定するSQLコマンド。データ統合サービスは、HiveServer2ジョブによって生成された各Hiveスクリプトの開始時に環境SQLを実行します。
環境SQLの使用には、以下のルールおよびガイドラインが適用されます。
  • 環境SQLは、PreSQLコマンド内またはカスタムクエリ内で使用するHadoopパラメータまたはHiveパラメータを定義するために使用できます。
  • 環境SQLプロパティに複数の値を使用する場合は、値の間にスペースを含めないようにしてください。
エンジンタイプ
データ統合サービスはHiveServer2を使用して、SparkエンジンでHiveServer2タスクを実行することで、いくつかのジョブの一部を処理します。Administratorツールを使用してクラスタ設定をインポートした場合は、接続を作成することを選択できます。エンジンタイププロパティは、ディストリビューションに基づいてデフォルトで設定されます。
接続を手動で作成する場合は、エンジンタイプを設定する必要があります。
次のHadoopディストリビューションに基づいてエンジンタイプを指定できます。
  • Amazon EMR。Tez
  • Azure HDI。Tez
  • Cloudera CDH。MRv2
  • Cloudera CDP。Tez
  • Dataproc。MRv2
  • Hortonworks HDP。Tez
  • MapR。MRv2
詳細プロパティ
Hadoop環境に固有な詳細プロパティのリスト。プロパティは、Blazeエンジン、エンジン、およびHiveエンジンに共通です。詳細プロパティには、デフォルトプロパティのリストが含まれます。
Hadoop環境のランタイムプロパティは、データ統合サービス、Hadoop接続、およびマッピングで構成できます。下位レベルで値を設定することにより、上位レベルで構成されたプロパティをオーバーライドできます。例えば、データ統合サービスのカスタムプロパティでプロパティを構成する場合は、Hadoop接続またはマッピングでオーバーライドできます。データ統合サービスは、次の優先順位に基づいてプロパティのオーバーライドを処理します。
  1. infacmd ms runMapping
    -cp
    オプションを指定して設定された、マッピングのカスタムプロパティ
  2. Hadoop環境のマッピングのランタイムプロパティ
  3. ランタイムエンジン用のHadoop接続の詳細プロパティ
  4. Hadoop接続の詳細な全般プロパティ、環境変数、およびクラスパス
  5. データ統合サービスのカスタムプロパティ
Informaticaは、サードパーティが提供するドキュメント、Informaticaが提供するドキュメント、またはInformaticaのグローバルカスタマサポートに問い合わせることなく、これらのプロパティ値を変更することはお勧めしません。プロパティに関する知識がないまま値を変更すると、パフォーマンスの低下やその他の予期しない結果が発生する可能性があります。