目次

Search

  1. はじめに
  2. トランスフォーメーションについて
  3. トランスフォーメーションポート
  4. トランスフォーメーションキャッシュ
  5. アドレスバリデータトランスフォーメーション
  6. アグリゲータトランスフォーメーション
  7. 関連付けトランスフォーメーション
  8. 不良レコードの例外トランスフォーメーション
  9. 大文字小文字変換プログラムトランスフォーメーション
  10. 分類子トランスフォーメーション
  11. 比較トランスフォーメーション
  12. 統合トランスフォーメーション
  13. データマスキングトランスフォーメーション
  14. データプロセッサトランスフォーメーション
  15. ディシジョントランスフォーメーション
  16. 重複レコードの例外トランスフォーメーション
  17. 式トランスフォーメーション
  18. フィルタトランスフォーメーション
  19. 階層型からリレーショナルへのトランスフォーメーション
  20. Javaトランスフォーメーション
  21. JavaトランスフォーメーションAPIのリファレンス
  22. Java式
  23. ジョイナトランスフォーメーション
  24. キージェネレータトランスフォーメーション
  25. ラベラトランスフォーメーション
  26. ルックアップトランスフォーメーション
  27. ルックアップキャッシュ
  28. 動的ルックアップキャッシュ
  29. マクロトランスフォーメーション
  30. 一致トランスフォーメーション
  31. フィールド分析での一致トランスフォーメーション
  32. ID分析での一致トランスフォーメーション
  33. ノーマライザトランスフォーメーション
  34. マージトランスフォーメーション
  35. パーサートランスフォーメーション
  36. Pythonトランスフォーメーション
  37. ランクトランスフォーメーション
  38. 読み取りトランスフォーメーション
  39. リレーショナルから階層型へのトランスフォーメーション
  40. REST Webサービスコンシューマトランスフォーメーション
  41. ルータトランスフォーメーション
  42. シーケンスジェネレータトランスフォーメーション
  43. ソータートランスフォーメーション
  44. SQLトランスフォーメーション
  45. 標準化トランスフォーメーション
  46. 共有体トランスフォーメーション
  47. アップデートストラテジトランスフォーメーション
  48. Webサービスコンシューマトランスフォーメーション
  49. WebサービスSOAPメッセージの解析
  50. WebサービスSOAPメッセージの生成
  51. 加重平均トランスフォーメーション
  52. ウィンドウトランスフォーメーション
  53. 書き込みトランスフォーメーション
  54. 付録 A: トランスフォーメーションの区切り文字

Developer Transformation Guide

Developer Transformation Guide

重複レコードの例外

重複レコードの例外

重複レコードの例外トランスフォーメーションを使用して、手動確認が必要な重複データのクラスタを識別できます。クラスタ内のレコードの一致スコアで、潜在的な重複が判別されます。トランスフォーメーションの一致スコアの上限および下限のしきい値を設定できます。上限および下限のしきい値によって、類似度が定義されます。
クラスタには、マッチング操作グループと一緒に関連レコードが含まれています。一致トランスフォーメーションでは、重複分析操作およびID解決操作を使用して、クラスタを作成します。クラスタ内の各レコードに同じクラスタIDがあります。クラスタ内で最も低い一致スコアがが上限しきい値と下限しきい値の間である場合、重複レコードの例外トランスフォーメーションでクラスタが重複レコードの例外クラスタとして識別されます。一致トランスフォーメーションでは、クラスタID値カラムをすべてのレコードに割り当てます。重複レコードは同じクラスタIDを受け取ります。
クラスタ内の最低レコードスコアにより、クラスタタイプが決まります。クラスタに一致スコアが0.95の11のレコードと、一致スコアが0.79の1つのレコードがあるとします。上限しきい値が0.9で下限しきい値が0.8の場合、例外トランスフォーメーションではレコードが一意のレコードテーブルに書き込まれます。