目次

Search

  1. はじめに
  2. Informatica Data Engineering Integrationについて
  3. マッピング
  4. マッピングの最適化
  5. ソース
  6. ターゲット
  7. トランスフォーメーション
  8. Pythonトランスフォーメーション
  9. データプレビュー
  10. クラスタワークフロー
  11. プロファイル
  12. 監視
  13. 階層データ処理
  14. 階層データ処理設定
  15. スキーマが変更された階層データの処理
  16. インテリジェント構造モデル
  17. ブロックチェーン
  18. ステートフルコンピューティング
  19. 付録 A: 接続リファレンス
  20. 付録 B: データ型リファレンス
  21. 付録 C: 関数リファレンス

フラットファイルターゲットHadoop上

フラットファイルターゲットHadoop上

Hadoop環境のフラットファイルターゲットについては、次のルールおよびガイドラインを考慮します。
  • Hadoop環境で実行されるマッピングは、ネイティブ環境のフラットファイルターゲットに書き込むことができます。
  • データ統合サービスは、ターゲットファイルを切り詰め、データの書き込み前にファイルを拒否します。フラットファイルターゲットの使用時に、データをそのターゲットファイルに追加し、ファイルを拒否することはできません。
  • データ統合サービスは、フラットファイルターゲットのファイル出力に書き込めます。マッピング内にフラットファイルターゲットがあるときは、データをコマンドに書き込むことはできません。
HDFSフラットファイルターゲットについては、次のルールおよびガイドラインを考慮します。
  • データ統合サービスは、ターゲットファイルを切り詰め、データの書き込み前にファイルを拒否します。出力データをHDFSターゲットファイルと許可ファイルに追加するには、HDFSターゲットが存在する場合にデータを追加するように選択します。
    拒否ファイルディレクトリがデータ統合サービスマシンにある場合は、データは拒否ファイルのみに追加されます。ディレクトリがHadoop環境にある場合は、拒否された行は上書きされます。
  • HDFSターゲットが存在する場合にデータを追加するように選択した場合は、データ統合サービスにより、マッピング実行IDがターゲットファイルおよび拒否ファイルの名前に追加されます。
  • マッピング内でHDFSフラットファイルターゲットを使用するときに、出力ファイルディレクトリとファイル名を含むフルパスを指定する必要があります。データ統合サービスは、マッピングをHadoop環境で実行すると、出力ディレクトリ内に複数の出力ファイルを生成する可能性があります。
  • HDFSターゲットは、リモートクラスタに置くことはできません。リモートクラスタは、マッピングでHadoop接続が参照するマシンのリモートにあるクラスタです。