目次

Search

  1. はじめに
  2. Informatica Data Engineering Integrationについて
  3. マッピング
  4. マッピングの最適化
  5. ソース
  6. ターゲット
  7. トランスフォーメーション
  8. Pythonトランスフォーメーション
  9. データプレビュー
  10. クラスタワークフロー
  11. プロファイル
  12. 監視
  13. 階層データ処理
  14. 階層データ処理設定
  15. スキーマが変更された階層データの処理
  16. インテリジェント構造モデル
  17. ブロックチェーン
  18. ステートフルコンピューティング
  19. 付録 A: 接続リファレンス
  20. 付録 B: データ型リファレンス
  21. 付録 C: 関数リファレンス

ユーザーガイド

ユーザーガイド

マッピングの例

マッピングの例

組織は、顧客ID、品目コード、品目数量などの発注書の詳細をHDFSのMicrosoft Excelスプレッドシートに保存しています。顧客のプライベートデータをすべて削除し、データを保存用のテキストファイルに変更して、データを監査に使用できるようにする必要があります。
インテリジェント構造を持つデータオブジェクトを使用することで、HDFS内のファイルからすべての注文レコードを読み取るマッピングを作成します。次に、このマッピングを使用してデータを解析し、そのデータをストレージターゲットに書き込みます。
次の図に、マッピングの例を示します。
HDFSマッピングの例は、複合ファイル入力、データプロセッサトランスフォーメーション、リレーショナル出力を示しています。
次のオブジェクトをHDFSマッピング内で使用できます。
HDFS入力
入力オブジェクトRead_transformation_with_intelligent_structure_modelは、HDFS内に保存されたMicrosoft Excelファイルを処理した読み取りトランスフォーメーションであり、フィールド出力を作成します。
Amazon S3出力
出力オブジェクトWrite_transformationは、Amazon S3バケットを表す読み取りトランスフォーメーションです。
マッピングを実行すると、データ統合サービスはバイナリストリーム内のファイルを読み取り、それを読み取りトランスフォーメーションに渡します。読み取りトランスフォーメーションは、インテリジェント構造に従って関連データを抽出し、データを書き込みトランスフォーメーションに渡します。書き込みトランスフォーメーションは、データをストレージターゲットに書き込みます。
Hadoopランタイム環境で実行するためのマッピングを設定できます。
マッピングを設定するには、次のタスクを実行します。
  1. Hadoopクラスタからのファイルを読み取るためのHDFS接続を作成します。
  2. 複合ファイルデータオブジェクト読み取り操作を作成します。次のパラメータを指定します。
    • データオブジェクト内のリソースとしてのインテリジェント構造。インテリジェント構造は、機密データを渡さないように設定されています。
    • HDFSファイルの場所。
    • 読み取りデータオブジェクト操作内の入力ファイルフォルダの場所。
  3. 複合ファイルデータオブジェクト読み取り操作をマッピングにドラッグアンドドロップします。
  4. Amazon S3接続を作成します。
  5. Amazon S3データオブジェクトの書き込みトランスフォーメーションを作成し、そのトランスフォーメーションをマッピングに追加します。