目次

Search

  1. はじめに
  2. Informatica Data Engineering Integrationについて
  3. マッピング
  4. マッピングの最適化
  5. ソース
  6. ターゲット
  7. トランスフォーメーション
  8. Pythonトランスフォーメーション
  9. データプレビュー
  10. クラスタワークフロー
  11. プロファイル
  12. 監視
  13. 階層データ処理
  14. 階層データ処理設定
  15. スキーマが変更された階層データの処理
  16. インテリジェント構造モデル
  17. ブロックチェーン
  18. ステートフルコンピューティング
  19. 付録 A: 接続リファレンス
  20. 付録 B: データ型リファレンス
  21. 付録 C: 関数リファレンス

ミッドストリーム解析のトラブルシューティング

ミッドストリーム解析のトラブルシューティング

ミッドストリームマッピングを使用して階層データを解析する場合は、次のトラブルシューティングのヒントを考慮してください。
ミッドストリームマッピングで、複合データを完全に解析することができなかった。
パーサーは解析できないデータフィールドを検出した場合、認識されないフィールドを無視するため、マッピングジョブは失敗しません。
PARSE_JSONおよびPARSE_XML複合関数は、次の場合、データを無視します。
  • JSONまたはXML構造が無効である。
  • JSONまたはXMLソースファイルに無効または認識されないデータが含まれている。
  • データが型定義ライブラリで提供されているスキーマと一致しない。
  • ソース文字列の複合データスキーマが変更されている。たとえば、サーバー上のソフトウェアの更新により、自動化されているJSONまたはXML入力が変更される場合があります。
  • 間違った要素がルートとして選択されているため、パーサーが配列内の親データをフラット化する可能性がある。
未解析データのトラブルシューティングを行うには、ソース文字列からデータをキャプチャし、
UnassignedData
配列に
unidentifiedDataItem
として保存します。その後、この情報を使用してデータを分析します。
Informaticaグローバルカスタマサポートに連絡して、内部KB 627032を参照してください。
このデバッグツールは、システムパフォーマンスに影響を与える可能性があります。
ミッドストリームマッピングでは、配列を解析するときにデータが失われます。
データの損失は、PARSE_JSONまたはPARSE_XML関数が、構造要素を持つ配列または多次元配列を含むスキーマを解析する場合に発生します。結果のデータ損失は、配列タイプによって異なります。以下に例を示します。
  • 構造要素を持つ配列。パーサー関数は、配列の最初の要素のみを返します。残りの配列要素は無視されます。
  • 構造要素を持つ多次元配列。パーサー関数は、中間配列要素に対して、配列ではなく構造を返します。
サンプルデータを使用してインテリジェント構造モデルを作成すると、
インテリジェント構造検出
は中間要素をルートノードとして選択します。たとえば、配列に構造要素が含まれている場合、
インテリジェント構造検出
は最初の構造要素をルートノードとして選択します。この動作により、ミッドストリーム解析のデータが失われます。データの損失を回避するには、最上位ノードをルートとして選択します。
Informatica Intelligent Cloud Services
インテリジェント構造検出
を使用して、インテリジェント構造モデルを変更します。
最上位ノードを選択し、右クリックして
[ルートとしてマーク]
を選択します。次の図は、ルートノードを変更する方法を示しています。
インテリジェント構造モデルには、配列である最上位ノードが含まれています。中間配列要素は現在のルートノードです。右クリックメニューに[ルートとしてマーク]オプションが表示されます。
茶色のノードは現在のルートノードを示しています。緑色のノードは選択されたルートノードを示しています。
詳細については、
Informatica Intelligent Cloud Services
データ統合
ヘルプの「インテリジェント構造モデル」セクションを参照してください。
データまたはフィールド名に特殊文字が含まれている場合、ミッドストリームマッピングは機能しません。
入力データはUTF-8文字列としてエンコードされます。Developer toolで入力フラットファイルデータオブジェクトの設定を確認してください。
[Object Explorer]ビューで、物理データオブジェクトの
[詳細 タブの]
[形式]
セクションにあるフラットファイルデータオブジェクトに移動し、
[コードページ]
属性を
UTF-8
に設定します。