目次

Search

  1. はじめに
  2. トランスフォーメーションについて
  3. トランスフォーメーションポート
  4. トランスフォーメーションキャッシュ
  5. アドレスバリデータトランスフォーメーション
  6. アグリゲータトランスフォーメーション
  7. 関連付けトランスフォーメーション
  8. 不良レコードの例外トランスフォーメーション
  9. 大文字小文字変換プログラムトランスフォーメーション
  10. 分類子トランスフォーメーション
  11. 比較トランスフォーメーション
  12. 統合トランスフォーメーション
  13. データマスキングトランスフォーメーション
  14. データプロセッサトランスフォーメーション
  15. ディシジョントランスフォーメーション
  16. 重複レコードの例外トランスフォーメーション
  17. 式トランスフォーメーション
  18. フィルタトランスフォーメーション
  19. 階層型からリレーショナルへのトランスフォーメーション
  20. Javaトランスフォーメーション
  21. JavaトランスフォーメーションAPIのリファレンス
  22. Java式
  23. ジョイナトランスフォーメーション
  24. キージェネレータトランスフォーメーション
  25. ラベラトランスフォーメーション
  26. ルックアップトランスフォーメーション
  27. ルックアップキャッシュ
  28. 動的ルックアップキャッシュ
  29. マクロトランスフォーメーション
  30. 一致トランスフォーメーション
  31. フィールド分析での一致トランスフォーメーション
  32. ID分析での一致トランスフォーメーション
  33. ノーマライザトランスフォーメーション
  34. マージトランスフォーメーション
  35. パーサートランスフォーメーション
  36. Pythonトランスフォーメーション
  37. ランクトランスフォーメーション
  38. 読み取りトランスフォーメーション
  39. リレーショナルから階層型へのトランスフォーメーション
  40. REST Webサービスコンシューマトランスフォーメーション
  41. ルータトランスフォーメーション
  42. シーケンスジェネレータトランスフォーメーション
  43. ソータートランスフォーメーション
  44. SQLトランスフォーメーション
  45. 標準化トランスフォーメーション
  46. 共有体トランスフォーメーション
  47. アップデートストラテジトランスフォーメーション
  48. Webサービスコンシューマトランスフォーメーション
  49. WebサービスSOAPメッセージの解析
  50. WebサービスSOAPメッセージの生成
  51. 加重平均トランスフォーメーション
  52. ウィンドウトランスフォーメーション
  53. 書き込みトランスフォーメーション
  54. 付録 A: トランスフォーメーションの区切り文字

Developer Transformation Guide

Developer Transformation Guide

マスターデータの分析

マスターデータの分析

一致トランスフォーメーションで2つのデータソースを分析するときは、ソースをマスタデータセットとして識別する必要があります。このトランスフォーメーションでは、指定したデータセット内の各レコードのデータ値を、2番目のデータセット内のすべてのレコードの対応する値と比較します。
多くの会社において、マスタデータセットは、固定で使用する質の高いデータストアを構成しています。レコードをマスタデータセットに追加する前に、一致トランスフォーメーションを使用してレコードが重複情報をマスタデータに追加しないことを検証します。

マスターデータの例

ある銀行が、顧客口座記録のマスタデータセットを管理しています。この銀行では、新規の顧客口座である識別されたレコードで毎日マスタデータセットを更新しています。この銀行は、マスタデータセットの中の新しいレコードで顧客情報が重複していないか確認するために、重複分析マッピングを使用します。マスタデータセットと新規口座のテーブルが共通の構造を持ち、テーブルが同じタイプのデータベースを使用しています。したがって、銀行はマスタデータセットを更新する必要があるたびに重複分析のマッピングを再利用することができます。

マスタデータセット分析の方向性

一致トランスフォーメーションでは、レコードを1つのデータセットから別のデータセットに単方向で比較します。 このトランスフォーメーションでは、マスタデータセット内の各レコードを2番目のデータセット内のすべてのレコードと比較します。 2番目のデータセット内の各レコードをマスタデータセット内のすべてのレコードと比較することはありません。 したがって、マスタデータセットの選択が照合分析の結果に影響する可能性があります。
次の表は、ID照合分析で比較できる2つのデータセットを示しています。
データセット1
データセット2
Alex Bell
Alexander Bell
Alexander Graham Bell
Thomas Edison
Alva Edison
Nicola Tesla
Marie Curie
Irene Joliot Curie
Dorothy Crowfoot
Dorothy Hodgkin
データセット1をマスタデータセットとして選択し、
[最良の一致]
出力オプションを選択した場合、出力に以下のレコードが含まれます。
  • Alex Bell, Alexander Bell
  • Alexander Graham Bell, Alexander Bell
データセット2をマスタデータセットとして選択し、
[最良の一致]
出力オプションを選択した場合、出力に以下のレコードが含まれます。
  • Alexander Bell, Alex Bell
データセット2がマスタデータセットの場合、トランスフォーメーションによって、Alexander BellとAlexander Graham Bellが一致する可能性はありません。Alexander Bellは出力データ内でAlex Bellとすでに一致しているためです。