目次

Search

  1. はじめに
  2. アナリストサービス
  3. カタログサービス
  4. コンテンツ管理サービス
  5. データ統合サービス
  6. データ統合サービスアーキテクチャ
  7. データ統合サービス管理
  8. データ統合サービスグリッド
  9. データ統合サービスREST API
  10. Data Integration Serviceアプリケーション
  11. Data Privacy Managementサービス
  12. Enterprise Data Preparationサービス
  13. Interactive Data Preparationサービス
  14. Informatica Cluster Service
  15. 一括取り込みサービス
  16. メタデータアクセスサービス
  17. Metadata Managerサービス
  18. モデルリポジトリサービス
  19. PowerCenter統合サービス
  20. PowerCenter統合サービスのアーキテクチャ
  21. PowerCenter統合サービスの高可用性
  22. PowerCenterリポジトリサービス
  23. PowerCenterリポジトリ管理
  24. PowerExchange Listenerサービス
  25. PowerExchangeロッガーサービス
  26. SAP BWサービス
  27. 検索サービス
  28. システムのサービス
  29. Test Data Managerサービス
  30. Test Data Warehouseサービス
  31. WebサービスHub
  32. アプリケーションサービスのアップグレード
  33. 付録 A: アプリケーションサービスのデータベース
  34. 付録 B: Windowsからのデータベースへの接続
  35. 付録 C: UNIXまたはLinuxからのデータベースへの接続
  36. 付録 D: DB2データベースのDynamicSectionsパラメータの更新

アプリケーションサービスガイド

アプリケーションサービスガイド

各パイプラインステージごとに複数のスレッド

各パイプラインステージごとに複数のスレッド

最大並列処理が2以上の値に設定されている場合、パーティション化が有効になっています。 データ統合サービスはマッピングをパイプラインステージに分割し、複数のスレッドを使用して各ステージを処理します。
並行処理を最大にすると、データ統合サービスは実行時に以下のタスクを動的に実行します。
データをパーティションに分割する。
データ統合サービスは基になるデータを動的にパーティションに分割し、各パーティションを同時に実行します。 データ統合サービスは、各パイプラインステージの最適なスレッド数を判断します。1つのパイプラインステージで使用されるスレッドの数は、最大並列処理数を超えることはできません。 データ統合サービスは、パイプラインステージごとに異なる数のスレッドを使用できます。
パーティションポイント全体にわたってデータを再分散する。
データ統合サービスは、トランスフォーメーション要件に基づいて、パーティションポイント全体にわたってデータを再分配する最善の方法を動的に決定します。
以下の図に、パイプラインステージごとに複数のパーティションにデータを分配するマッピングの例を示します。
このマッピングでは、読み取りパイプラインステージと最初のトランスフォーメーションパイプラインステージを2つのパーティションに分配しています。 2番目のトランスフォーメーションパイプラインステージでは、マッピングが対象行を3つのパーティションに再分配しています。 最後に、書き込みパイプラインステージを3つのパーティションに分配しています。
上図では、データ統合サービスの最大並列処理の値は3です。 マッピングの最大並列処理は自動です。 データ統合サービスは、マッピングを4つのパイプラインステージに分け、合計12個のスレッドを使用してマッピングを実行します。データ統合サービスは、各パイプラインステージで以下のタスクを実行します。
  • 読み取りパイプラインステージでは、データ統合サービスは、Oracleデータベースシステムに問い合わせて、ソースAとソースBの両方のソーステーブルに2つのデータベースパーティションが存在することを検出します。 データ統合サービスは、各データベースパーティションについて1つの読み取りスレッドを使用します。
  • 最初のトランスフォーメーションパイプラインステージで、データ統合サービスは、データを再配分して結合条件を満たす行を2つのスレッドに分割します。
  • 2番目のトランスフォーメーションパイプラインステージで、データ統合サービスは、このアグリゲータトランスフォーメーションには3つのスレッドが最適であると判断します。 そして、データを再配分して、集計式を満たす行を3つのスレッドに分割します。
  • 書き込みパイプラインステージで、データ統合サービスは、ターゲットパーティションポイント全体にわたって行を再配分する必要がありません。 単一パーティション内のすべての行は、ターゲットパーティションポイントを通過した後、そのパーティション内に留まります。