Hi, I'm Ask INFA!
What would you like to know?
ASK INFAPreview
Please to access Ask INFA.

目次

Search

  1. はじめに
  2. トランスフォーメーション
  3. ソーストランスフォーメーション
  4. ターゲットトランスフォーメーション
  5. アクセスポリシートランスフォーメーション
  6. アグリゲータトランスフォーメーション
  7. B2Bトランスフォーメーション
  8. チャンキングトランスフォーメーション
  9. クレンジングトランスフォーメーション
  10. データマスキングトランスフォーメーション
  11. データサービストランスフォーメーション
  12. 重複排除トランスフォーメーション
  13. 式トランスフォーメーション
  14. フィルタトランスフォーメーション
  15. 階層ビルダートランスフォーメーション
  16. 階層パーサートランスフォーメーション
  17. 階層プロセッサトランスフォーメーション
  18. 入力トランスフォーメーション
  19. Javaトランスフォーメーション
  20. JavaトランスフォーメーションAPIリファレンス
  21. ジョイナトランスフォーメーション
  22. ラベラトランスフォーメーション
  23. ルックアップトランスフォーメーション
  24. 機械学習トランスフォーメーション
  25. マップレットトランスフォーメーション
  26. ノーマライザトランスフォーメーション
  27. 出力トランスフォーメーション
  28. 解析トランスフォーメーション
  29. Pythonトランスフォーメーション
  30. ランクトランスフォーメーション
  31. ルータトランスフォーメーション
  32. ルール仕様トランスフォーメーション
  33. シーケンストランスフォーメーション
  34. ソータートランスフォーメーション
  35. SQLトランスフォーメーション
  36. 構造パーサートランスフォーメーション
  37. トランザクション制御トランスフォーメーション
  38. 共有体トランスフォーメーション
  39. ベクトル埋め込みトランスフォーメーション
  40. Velocityトランスフォーメーション
  41. ベリファイヤトランスフォーメーション
  42. Webサービストランスフォーメーション

トランスフォーメーション

トランスフォーメーション

構造パーサートランスフォーメーションのルールおよびガイドライン

構造パーサートランスフォーメーションのルールおよびガイドライン

構造パーサートランスフォーメーションを使用する場合は、次のルールおよびガイドラインを考慮してください。
  • Mapping Designerで構造パーサートランスフォーメーションを含むマッピングを開き、トランスフォーメーションに関連付けられている
    インテリジェント構造モデル
    を変更した場合、Mapping Designerにメッセージが表示されます。メッセージ内に提示されるリンクをクリックして、マッピングに適合するようにモデルを更新します。
  • すべての出力フィールドに文字列データ型が割り当てられていた古いバージョンの
    インテリジェント構造検出
    で作成された
    インテリジェント構造モデル
    を更新すると、更新中に構造パーサートランスフォーメーションによってフィールドデータ型が変更される可能性があります。影響を受けるフィールドのいずれかにおいて、ダウンストリームトランスフォーメーションまたはターゲットに文字列が必要である場合は、データ型を文字列に戻すようにモデルを編集します。次に、Mapping Designerで提示されたリンクをクリックして、トランスフォーメーション内のモデルを再度更新します。
    インテリジェント構造モデル
    を編集する方法については、「
    コンポーネント
    」を参照してください。
  • 次の条件がすべて当てはまる場合、構造パーサートランスフォーメーションはXSD入力ファイル内の再帰的要素を解析できます。
    • 再帰的要素が繰り返し要素内にネストされていない。
    • 再帰的要素に常に同じ名前の要素が使用されている。
    • 構造パーサートランスフォーメーションが詳細モードのマッピングで使用されていない。
    トランスフォーメーションで再帰的要素を解析できない場合は、単一の出力グループにデータが出力されます。このトランスフォーメーションでは、2023年10月リリース以降に作成されたマッピング、または2023年10月リリースにアップグレードした後にスキーマファイルを再アップロードした場合に、マッピング内の再帰的要素を解析できます。
  • マップレットで構造パーサートランスフォーメーションを使用する場合は、ランタイムエラーを防ぐために、組み合わせたマップレットトランスフォーメーション名が80文字を超えないようにしてください。詳細については、マップレットトランスフォーメーション名を参照してください。

詳細モードのマッピングに関するルールとガイドライン

詳細モードのマッピングで構造パーサートランスフォーメーションを使用する場合は、次のルールおよびガイドラインを考慮してください。
  • 詳細モードでは、構造パーサートランスフォーメーションはJSONオブジェクトを入力として処理できますが、JSON配列は処理できません。
  • 詳細モードのデフォルトでは、ソースデータのスキーマと、トランスフォーメーションに関連付けられたインテリジェント構造モデルのスキーマが正確に一致する必要があり、トランスフォーメーションはパススルーフィールドを処理できません。パススルーフィールドを処理するには、マッピングタスクのSparkセッションプロパティで次のSparkカスタムプロパティを設定します:
    Spark.MSPEnableUnassigedData=true
    このプロパティを設定すると、出力グループには
    UnassignedData
    という配列が含まれます。この配列には、インテリジェント構造によって識別されなかったデータが含まれています。

出力タイプのルールおよびガイドライン

構造パーサートランスフォーメーションの出力タイプを選択する場合は、次のルールおよびガイドラインを考慮してください。
  • Parquet出力タイプを使用するには、まず
    HADOOP_HOME
    および
    hadoop.home.dir
    環境変数を設定します。
  • AVRO出力タイプを使用する場合、トランスフォーメーションでは同じ名前の入力フィールドの出力は生成されません。
  • トランスフォーメーションはORC出力をローカルの日時に基づいて作成します。同じ入力を異なる場所または環境で処理すると、時間および時間形式が異なる出力が生成される可能性があります。
  • 大規模なXMLファイルやJSONファイルを作成するには、バイナリ出力タイプを使用することをお勧めします。