目次

Search

  1. はじめに
  2. Informatica Big Data Managementの概要
  3. マッピング
  4. ソース
  5. ターゲット
  6. トランスフォーメーション
  7. クラスタワークフロー
  8. プロファイル
  9. 監視
  10. 階層データ処理
  11. 階層データ処理設定
  12. スキーマが変更された階層データの処理
  13. インテリジェント構造モデル
  14. ステートフルコンピューティング
  15. 接続
  16. データ型リファレンス
  17. 関数リファレンス

ユーザーガイド

ユーザーガイド

マッピングの例

マッピングの例

あなたの組織は、顧客ID、品目コード、品目の数量などの注文書の詳細を分析する必要があります。注文書の詳細は、HDFSのMicrosoft Excelスプレッドシート内に保存されています。このデータは、ストレージ用にテキストファイルに変更される必要があります。さらに、非公開の顧客データは削除される必要があります。インテリジェント構造を持つデータオブジェクトを使用することで、HDFS内のファイルからすべての注文レコードを読み取るマッピングを作成します。このマッピングは、データを解析し、そのデータをストレージターゲットに書き込む必要があります。
監査のために抽出データを使用できます。
次の図に、マッピングの例を示します。
HDFSマッピングの例は、複合ファイル入力、データプロセッサトランスフォーメーション、リレーショナル出力を示しています。
次のオブジェクトをHDFSマッピング内で使用できます。
HDFS入力
入力オブジェクトRead_transformation_with_intelligent_structure_modelは、HDFS内に保存されたMicrosoft Excelファイルを処理した読み取りトランスフォーメーションであり、フィールド出力を作成します。
Amazon S3出力
出力オブジェクトWrite_transformationは、Amazon S3バケットを表す読み取りトランスフォーメーションです。
マッピングを実行すると、データ統合サービスはバイナリストリーム内のファイルを読み取り、それを読み取りトランスフォーメーションに渡します。読み取りトランスフォーメーションは、インテリジェント構造に従って関連データを抽出し、データを書き込みトランスフォーメーションに渡します。書き込みトランスフォーメーションは、データをストレージターゲットに書き込みます。
Hadoopランタイム環境で実行するためのマッピングを設定できます。
マッピングを設定するには、次のタスクを実行します。
  1. Hadoopクラスタからのファイルを読み取るためのHDFS接続を作成します。
  2. 複合ファイルデータオブジェクト読み取り操作を作成します。次のパラメータを指定します。
    • データオブジェクト内のリソースとしてのインテリジェント構造。インテリジェント構造は、機密データを渡さないように設定されています。
    • HDFSファイルの場所。
    • 読み取りデータオブジェクト操作内の入力ファイルフォルダの場所。
  3. 複合ファイルデータオブジェクト読み取り操作をマッピングにドラッグアンドドロップします。
  4. Amazon S3接続を作成します。
  5. Amazon S3データオブジェクトの書き込みトランスフォーメーションを作成し、そのトランスフォーメーションをマッピングに追加します。