目次

Search

  1. はじめに
  2. トランスフォーメーションについて
  3. トランスフォーメーションポート
  4. トランスフォーメーションキャッシュ
  5. アドレスバリデータトランスフォーメーション
  6. アグリゲータトランスフォーメーション
  7. 関連付けトランスフォーメーション
  8. 不良レコードの例外トランスフォーメーション
  9. 大文字小文字変換プログラムトランスフォーメーション
  10. 分類子トランスフォーメーション
  11. 比較トランスフォーメーション
  12. 統合トランスフォーメーション
  13. データマスキングトランスフォーメーション
  14. データプロセッサトランスフォーメーション
  15. ディシジョントランスフォーメーション
  16. 重複レコードの例外トランスフォーメーション
  17. 式トランスフォーメーション
  18. フィルタトランスフォーメーション
  19. 階層型からリレーショナルへのトランスフォーメーション
  20. Javaトランスフォーメーション
  21. JavaトランスフォーメーションAPIのリファレンス
  22. Java式
  23. ジョイナトランスフォーメーション
  24. キージェネレータトランスフォーメーション
  25. ラベラトランスフォーメーション
  26. ルックアップトランスフォーメーション
  27. ルックアップキャッシュ
  28. 動的ルックアップキャッシュ
  29. マクロトランスフォーメーション
  30. 一致トランスフォーメーション
  31. フィールド分析での一致トランスフォーメーション
  32. ID分析での一致トランスフォーメーション
  33. ノーマライザトランスフォーメーション
  34. マージトランスフォーメーション
  35. パーサートランスフォーメーション
  36. Pythonトランスフォーメーション
  37. ランクトランスフォーメーション
  38. 読み取りトランスフォーメーション
  39. リレーショナルから階層型へのトランスフォーメーション
  40. REST Webサービスコンシューマトランスフォーメーション
  41. ルータトランスフォーメーション
  42. シーケンスジェネレータトランスフォーメーション
  43. ソータートランスフォーメーション
  44. SQLトランスフォーメーション
  45. 標準化トランスフォーメーション
  46. 共有体トランスフォーメーション
  47. アップデートストラテジトランスフォーメーション
  48. Webサービスコンシューマトランスフォーメーション
  49. WebサービスSOAPメッセージの解析
  50. WebサービスSOAPメッセージの生成
  51. 加重平均トランスフォーメーション
  52. ウィンドウトランスフォーメーション
  53. 書き込みトランスフォーメーション
  54. 付録 A: トランスフォーメーションの区切り文字

Developer Transformation Guide

Developer Transformation Guide

ハミング距離

ハミング距離

電話番号、郵便番号、製品コードなどの数値フィールドやコードフィールドのように、データ文字の位置が重要な要素である場合には、ハミング距離アルゴリズムを使用します。
ハミング距離アルゴリズムでは、2つのデータ文字列の一致スコアを、データ文字列間で文字が異なる位置の数に基づいて計算します。 長さが異なる文字列の場合、長い方の文字列にしかない各文字は文字列間の相違としてカウントされます。

ハミング距離の例

次の文字列について考えてみます。
  • Morlow
  • M
    a
    rlow
    es
強調表示された文字は、ハミングアルゴリズムで相違と見なされる位置を示しています。
ハミングの一致スコアを計算するには、一致する文字の数(5)を長い方の文字列の文字数(8)で割ります。 この例では、文字列の類似度は62.5%で、一致スコアは
0.625
になります。