目次

Search

  1. はじめに
  2. Informatica Data Engineering Integrationについて
  3. マッピング
  4. マッピングの最適化
  5. ソース
  6. ターゲット
  7. トランスフォーメーション
  8. Pythonトランスフォーメーション
  9. データプレビュー
  10. クラスタワークフロー
  11. プロファイル
  12. 監視
  13. 階層データ処理
  14. 階層データ処理設定
  15. スキーマが変更された階層データの処理
  16. インテリジェント構造モデル
  17. ブロックチェーン
  18. ステートフルコンピューティング
  19. 付録 A: 接続リファレンス
  20. 付録 B: データ型リファレンス
  21. 付録 C: 関数リファレンス

階層データを解析するためのミッドストリームマッピングの使用方法

階層データを解析するためのミッドストリームマッピングの使用方法

Sparkエンジンのソース文字列内の階層データを解析するためのミッドストリームマッピングを開発します。
次の高レベルのタスクでは、ソース文字列内の階層データを解析するマッピングを開発して実行する方法について説明します。
接続の作成
ファイルストレージに基づいて複合ファイル内のデータにアクセスする接続を作成します。
データオブジェクトの作成
  1. JSONまたはXML形式の階層データを含むソース文字列でソースファイルを表すデータオブジェクトを作成します。
  2. 構造に階層データを含むターゲットを表すデータオブジェクトを作成します。
  3. データオブジェクトのプロパティを設定します。
複合データ型定義を作成またはインポートします。
インテリジェント構造検出
はサンプルデータを解析し、ソース文字列内の階層データのスキーマを検出します。次の選択肢を使用できます。
  • Informatica Intelligent Cloud Services
    インテリジェント構造検出
    の代表的なサンプルファイルを使用して、複合データ型定義を作成します。
  • 既存の
    インテリジェント構造検出
    .amodel
    複合データ型定義をインポートします。
  • Developer toolの代表的なサンプルファイルを使用して、複合データ型定義を作成します。
複合データ型定義は、モデルリポジトリオブジェクトである型定義ライブラリに格納されます。型定義ライブラリのデフォルトの名前は、m_Type_Definition_Libraryです。
ミッドストリームマッピングの複合データ型定義を手動で作成することはできません。
マッピングを作成し、マッピングオブジェクトを追加します。
  1. マッピングを作成し、読み取りトランスフォーメーション、書き込みトランスフォーメーションを追加します。
  2. ソース文字列から階層データを読み取る読み取りトランスフォーメーションを作成します。
  3. 階層データをターゲットの構造に書き込む書き込みトランスフォーメーションを作成します。
  4. PARSE_JSONまたはPARSE_XML関数の式トランスフォーメーションを作成します。
  5. マッピングロジックに基づいて、ランタイムエンジンでサポートされるその他のトランスフォーメーションを追加します。
トランスフォーメーション内のポートを作成して設定します。
  1. 階層データを含む文字列Typeを含む読み取りポートを作成します。
  2. 解析された階層データを含む構造Typeを含む書き込みポートを作成します。
  3. 式ポートを作成します。
    入力文字列を入力および出力として設定します。
    出力構造を出力として設定します。型定義は、作成またはインポートした複合データ型定義を参照する必要があります。式にPARSE_JSONまたはPARSE_XML関数を設定します。
トランスフォーメーションを設定する。
マッピングロジックに基づいて、ポートをリンクしトランスフォーメーションプロパティを設定します。
マッピングプロパティを設定します。
マッピングランタイムプロパティを設定します: Spark検証環境とHadoopを実行環境として選択します。
マッピングを検証して実行します。
  1. マッピングを検証してエラーを特定および修正します。
  2. 必要に応じて、エンジン実行プランを表示し、ロジックをデバッグします。
  3. マッピングを実行します。