目次

Search

  1. はじめに
  2. Informatica Data Engineering Integrationについて
  3. マッピング
  4. マッピングの最適化
  5. ソース
  6. ターゲット
  7. トランスフォーメーション
  8. Pythonトランスフォーメーション
  9. データプレビュー
  10. クラスタワークフロー
  11. プロファイル
  12. 監視
  13. 階層データ処理
  14. 階層データ処理設定
  15. スキーマが変更された階層データの処理
  16. インテリジェント構造モデル
  17. ブロックチェーン
  18. ステートフルコンピューティング
  19. 付録 A: 接続リファレンス
  20. 付録 B: データ型リファレンス
  21. 付録 C: 関数リファレンス

ユーザーガイド

ユーザーガイド

Sparkエンジンでのデータプレビューに関するルールとガイドライン

Sparkエンジンでのデータプレビューに関するルールとガイドライン

Sparkエンジン上でのデータプレビューの操作を行う場合は、次のルールとガイドラインを考慮します。
  • 動的配列、動的マップ、動的構造などの動的複合データ型を含むマッピングではデータをプレビューできません。
  • プリミティブキーを含むマップデータ型ソースでキーが重複している場合、データビューアには重複したキーと値のペアのインスタンスが1つだけ表示されます。複合キーを含むマップデータ型ソースでキーが重複している場合、データビューアにはキーと値のペアがすべて表示されます。
  • Hiveソースから階層データを読み取るマッピングのデータはプレビューできません。
  • Sparkエンジン上で最大10個の同時データプレビュージョブを実行できます。
  • Sparkエンジンでデータをプレビューすると、メモリ負荷が高くなります。プレビュージョブを同時実行する場合は、ヒープメモリサイズを増やします。
  • Spark Jobserverを使用する大容量データのプレビュージョブの場合は、Hadoop接続で次のSpark詳細プロパティを設定してドライバとExecutorのメモリを増やします。

      spark.driver.cores

      spark.driver.memory

      spark.executor.cores

      spark.executor.memory

    詳細については、Sparkの詳細プロパティを参照してください。
  • バージョン10.4.0では、データ統合サービスがグリッド上で実行されているときに階層データをプレビューできるようになりました。
テクニカルプレビュー機能は評価を目的としてサポートされていますが、保証対象外で、本番環境または本番環境にプッシュする予定の環境には対応していません。Informaticaは、本番環境用の今後のリリースにプレビュー機能を含める予定ですが、市場や技術的な状況の変化に応じて導入を行わない場合もあります。詳細については、Informaticaグローバルカスタマサポートにお問い合わせください。