目次

Search

  1. はじめに
  2. アナリストサービス
  3. カタログサービス
  4. コンテンツ管理サービス
  5. データ統合サービス
  6. データ統合サービスアーキテクチャ
  7. データ統合サービス管理
  8. データ統合サービスグリッド
  9. データ統合サービスREST API
  10. Data Integration Serviceアプリケーション
  11. Data Privacy Managementサービス
  12. Enterprise Data Preparationサービス
  13. Interactive Data Preparationサービス
  14. Informatica Cluster Service
  15. 一括取り込みサービス
  16. メタデータアクセスサービス
  17. Metadata Managerサービス
  18. モデルリポジトリサービス
  19. PowerCenter統合サービス
  20. PowerCenter統合サービスのアーキテクチャ
  21. PowerCenter統合サービスの高可用性
  22. PowerCenterリポジトリサービス
  23. PowerCenterリポジトリ管理
  24. PowerExchange Listenerサービス
  25. PowerExchangeロッガーサービス
  26. SAP BWサービス
  27. 検索サービス
  28. システムのサービス
  29. Test Data Managerサービス
  30. Test Data Warehouseサービス
  31. WebサービスHub
  32. アプリケーションサービスのアップグレード
  33. 付録 A: アプリケーションサービスのデータベース
  34. 付録 B: Windowsからのデータベースへの接続
  35. 付録 C: UNIXまたはLinuxからのデータベースへの接続
  36. 付録 D: DB2データベースのDynamicSectionsパラメータの更新

アプリケーションサービスガイド

アプリケーションサービスガイド

データプレビューサービスモジュール

データプレビューサービスモジュール

データプレビューサービスモジュールは、マッピング内のソースまたはトランスフォーメーションデータをプレビューするDeveloper toolからの要求を管理します。
データをプレビューするとき、Developer toolはデータ統合サービスに要求を送信します。データ統合サービスは、データプレビューサービスモジュールを使用して、プレビューポイントに基づいてジョブをネイティブ環境で実行するか非ネイティブ環境で実行するかを決定します。プレビューポイントは、データを表示するよう選択したマッピング内のオブジェクトです。
データプレビュージョブは、データ統合サービスまたはSparkエンジンのいずれかで実行されます。Sparkエンジンは、次の場合にジョブを実行します。
  • プレビューポイントまたはアップストリームトランスフォーメーションに、階層データが含まれる。
  • プレビューポイントまたはアップストリームトランスフォーメーションがPythonトランスフォーメーションである。
  • プレビューポイントまたはアップストリームトランスフォーメーションがウィンドウ処理用に構成された式トランスフォーメーションである。
  • マッピングに、Sparkエンジンでの実行が必要なトランスフォーメーションの組み合わせが含まれる。
Sparkエンジンがデータプレビュージョブを実行すると、ジョブでは、構成したクラスタディストリビューションに応じて、Spark Jobserverまたはspark-submitスクリプトが使用されます。Sparkジョブサーバーをサポートする配布を使用してマッピング設定する場合、データプレビューサービスモジュールはSparkジョブサーバーを使用してSparkエンジン上でプレビュージョブを実行します。そうではない場合、データプレビューサービスモジュールはSpark送信スクリプトを使用します。
サポートされるクラスタディストリビューションの詳細については、
Data Engineering Integrationユーザーガイド
を参照してください。
Spark Jobserverを使用するプレビュー要求をデータ統合サービスが受信すると、データプレビューサービスモジュールはSpark Jobserverを開始し、LDTMにマッピングを渡します。LDTMはSparkワークフローを生成し、SparkジョブサーバーはHadoopクラスタ上でジョブを実行します。データプレビュージョブは、設定済みのHDFSステージングディレクトリで結果をステージングします。データ統合サービスは、ステージングされたデータをDeveloper toolに渡します。