目次

Search

  1. はじめに
  2. パフォーマンスのチューニングの概要
  3. ターゲットの最適化
  4. ソースの最適化
  5. トランスフォーメーションの最適化
  6. マッピングの最適化
  7. パーティション化したマッピングの最適化
  8. 実行時の最適化
  9. SQLデータサービスの最適化
  10. Webサービスの最適化
  11. 接続の最適化

パフォーマンスのチューニングの概要

パフォーマンスのチューニングの概要

ジョイナトランスフォーメーションの最適化

ジョイナトランスフォーメーションの最適化

ジョイナトランスフォーメーションでは、中間結果を格納するための追加領域を実行時に必要とするため、パフォーマンスが低下することがあります。
ジョイナトランスフォーメーションに関するボトルネックを減らすには、以下の方法を検討します。
重複キー値が少ない方のソースをマスタとして指定します。
データ統合サービスは、ソート済みジョイナトランスフォーメーションを処理するときに、一度に100個の一意なキーの行をキャッシュに格納します。 マスタソースに同じキー値を持つ多数の行が含まれる場合、データ統合サービスはより多くの行をキャッシュに格納する必要があり、それによってパフォーマンスが低下することがあります。
行数が少ない方のソースをマスタとして指定します。
ジョイナトランスフォーメーションは詳細ソースの各行をマスタソースと比較します。 マスタ内の行が少なければ、結合のための比較が繰り返される回数も少なくなり、その結果、結合プロセスが高速になります。
可能な場合は、データベース内で結合を実行します。
データベース内で結合を実行すると、マッピングの実行中に実行する場合よりも処理が高速になります。パフォーマンスは、使用するデータベース結合の種類によっても変わってきます。ノーマル結合は、外部結合よりも高速で、結果的にレコード数が少なくて済みます。場合によっては、例えば2つの異なるデータベースまたはフラットファイルシステムとテーブルを結合する場合は、これが不可能なこともあります。
可能な場合は、ソート済みデータを結合します。
ソート済み入力を使用するようにジョイナトランスフォーメーションを設定してください。 データ統合サービスは、ディスクの入出力を最小化することによってパフォーマンスを向上させます。 パフォーマンスは、大量のデータセットを扱う場合に最大限に向上させることができます。未ソートジョイナトランスフォーメーションの場合、行の比較的少ないソースをマスタソースとして指定します。
結合条件を最適化する。
データ統合サービスは、小さい方のグループから行を読み取り、大きい方のグループで一致する行を見つけて結合操作を実行することで、1つの結合オペランドのデータセットのサイズを小さくしようとします。データセットのサイズを小さくすると、データ統合サービスで大きい方のグループソースから不要な行が読み取られなくなるため、マッピングのパフォーマンスが向上します。データ統合サービスによって、結合条件が大きい方のグループソースに移動され、小さい方のグループと一致する行のみが読み取られます。
準結合最適化方式を使用する。
一方の入力グループに他方よりも多くの行が含まれており、結合条件に基づいて、小さい方のグループに一致するものがない行が大きい方のグループに多数含まれている場合は、準結合最適化方式を使用するとマッピングのパフォーマンスが向上します。