目次

Search

  1. はじめに
  2. トランスフォーメーションについて
  3. トランスフォーメーションポート
  4. トランスフォーメーションキャッシュ
  5. アドレスバリデータトランスフォーメーション
  6. アグリゲータトランスフォーメーション
  7. 関連付けトランスフォーメーション
  8. 不良レコードの例外トランスフォーメーション
  9. 大文字小文字変換プログラムトランスフォーメーション
  10. 分類子トランスフォーメーション
  11. 比較トランスフォーメーション
  12. 統合トランスフォーメーション
  13. データマスキングトランスフォーメーション
  14. データプロセッサトランスフォーメーション
  15. ディシジョントランスフォーメーション
  16. 重複レコードの例外トランスフォーメーション
  17. 式トランスフォーメーション
  18. フィルタトランスフォーメーション
  19. 階層型からリレーショナルへのトランスフォーメーション
  20. Javaトランスフォーメーション
  21. JavaトランスフォーメーションAPIのリファレンス
  22. Java式
  23. ジョイナトランスフォーメーション
  24. キージェネレータトランスフォーメーション
  25. ラベラトランスフォーメーション
  26. ルックアップトランスフォーメーション
  27. ルックアップキャッシュ
  28. 動的ルックアップキャッシュ
  29. マクロトランスフォーメーション
  30. 一致トランスフォーメーション
  31. フィールド分析での一致トランスフォーメーション
  32. ID分析での一致トランスフォーメーション
  33. ノーマライザトランスフォーメーション
  34. マージトランスフォーメーション
  35. パーサートランスフォーメーション
  36. Pythonトランスフォーメーション
  37. ランクトランスフォーメーション
  38. 読み取りトランスフォーメーション
  39. リレーショナルから階層型へのトランスフォーメーション
  40. REST Webサービスコンシューマトランスフォーメーション
  41. ルータトランスフォーメーション
  42. シーケンスジェネレータトランスフォーメーション
  43. ソータートランスフォーメーション
  44. SQLトランスフォーメーション
  45. 標準化トランスフォーメーション
  46. 共有体トランスフォーメーション
  47. アップデートストラテジトランスフォーメーション
  48. Webサービスコンシューマトランスフォーメーション
  49. WebサービスSOAPメッセージの解析
  50. WebサービスSOAPメッセージの生成
  51. 加重平均トランスフォーメーション
  52. ウィンドウトランスフォーメーション
  53. 書き込みトランスフォーメーション
  54. 付録 A: トランスフォーメーションの区切り文字

Developerトランスフォーメーションガイド

Developerトランスフォーメーションガイド

重複レコードの例外の[設定]ビュー

重複レコードの例外の[設定]ビュー

一致スコアしきい値を定義し、重複レコードの例外トランスフォーメーションで各種出力データを書き込む場所を設定します。
以下の図に、設定可能なプロパティを示します。
[設定]ビューに、下限しきい値が.80、上限しきい値が.95と表示されます。このビューには、データルーティングのオプションとして「自動統合」が標準出力に設定されています。手動統合が重複レコードテーブルに設定されます。一意のレコードはどちらの出力にも設定されていません。一意のレコード専用の出力グループを作成するためのチェックボックスはオフになっています。このビューの下部には、重複レコードテーブルを生成するためのボタンがあります。
以下のプロパティを設定することができます。
下限しきい値
重複レコードのスコア範囲の下限です。トランスフォーメーションは、一致スコアがこの値を下回るレコードを一意のレコードとして処理します。下限しきい値は0~1の数値です。
上限しきい値
重複レコードのスコア範囲の上限です。トランスフォーメーションは、一致スコアが上限しきい値以上、または同等のレコードを重複レコードとして処理します。上限しきい値は下限しきい値を超える数値です。
自動統合
すべてのレコードに上限しきい値を超える一致スコアがあるクラスタ。自動統合クラスタは確認が不要です。レコードは重複しています。レコードの結合には、統合トランスフォーメーションを使用できます。デフォルトでは、重複レコードの例外トランスフォーメーションは自動統合クラスタを標準出力ポートに書き込みます。
手動統合
すべてのレコードに下限しきい値以上または同等の一致スコアがあり、少なくとも1つのレコードに上限しきい値を下回る一致スコアがあるクラスタ。クラスタに重複レコードが含まれているかどうかを判断するには、クラスタの手動確認を実行する必要があります。デフォルトでは、重複レコードの例外トランスフォーメーションは手動統合レコードを重複レコードテーブルに書き込みます。
一意統合
サイズが1であるクラスタ、またはレコードのどれかに下限しきい値を下回る一致スコアがあるクラスタ。一意のレコードクラスタは重複していません。 デフォルトでは、重複レコードの例外トランスフォーメーションは一意のレコードを出力テーブルに書き込みません。
標準出力
標準出力ポートに書き込まれるレコードのタイプです。
デフォルトは自動統合レコードです。
重複レコードテーブル
重複レコード出力ポートに書き込まれるレコードのタイプです。デフォルトは手動統合レコードです。
一意のレコードのための独立した出力グループを作成
一意のレコードのために別の出力グループを作成します。一意のレコードのために別のテーブルを作成しない場合は、一意のレコードを他のグループのどれかに書き込むためのトランスフォーメーションを設定できます。あるいは、一意のレコードを出力テーブルに書き込む処理をスキップすることも可能です。デフォルトでは無効になっています。
重複レコードテーブルの生成
重複レコードのクラスタデータを含める、データベースオブジェクトを作成します。 このオプションを選択すると、Developerツールによってデータベースオブジェクトが作成されます。Developerツールは、オブジェクトをモデルリポジトリに追加し、オブジェクトのインスタンスをマッピングキャンバスに追加し、ポートをオブジェクトにリンクします。