目录

Search

  1. 前言
  2. 转换简介
  3. 转换端口
  4. 转换缓存
  5. 地址验证器转换
  6. 汇总器转换
  7. 关联转换
  8. 离散记录异常转换
  9. 大小写转换器转换
  10. 分类器转换
  11. 比较转换
  12. 合并转换
  13. 数据屏蔽转换
  14. 数据处理器转换
  15. 判定转换
  16. 重复记录异常转换
  17. 表达式转换
  18. 筛选器转换
  19. 层次结构到关系转换
  20. Java 转换
  21. Java 转换 API 引用
  22. Java 表达式
  23. 联接器转换
  24. 键生成器转换
  25. 标签创建器转换
  26. 查找转换
  27. 查找缓存
  28. 动态查找缓存
  29. 匹配转换
  30. 字段分析中的匹配转换
  31. 标识分析中的匹配转换
  32. 规范器转换
  33. 合并转换
  34. 解析器转换
  35. Python 转换
  36. 等级转换
  37. 读取转换
  38. 关系到层次结构转换
  39. REST Web 服务使用者转换
  40. 路由器转换
  41. 序列生成器转换
  42. 排序器转换
  43. SQL 转换
  44. 标准创建器转换
  45. 联合转换
  46. 更新策略转换
  47. Web 服务使用者转换
  48. 解析 Web 服务 SOAP 消息
  49. 生成 Web 服务 SOAP 消息
  50. 加权平均值转换
  51. 窗口转换
  52. 写入转换
  53. 转换分隔符

Developer 转换指南

Developer 转换指南

匹配转换概览

匹配转换概览

匹配转换属于主动转换,用于分析不同记录之间的相似度水平。 使用匹配转换可以查找在一个数据集中或者在两个数据集之间包含重复信息的记录。
匹配转换分析输入端口上的值并生成一组数值型得分,用于表示不同值之间的相似度。 可以选择多个端口来确定两个输入记录之间的总体相似度水平。 指定一个最低得分作为阈值来标识可能包含重复信息的记录。
匹配转换可以用于以下数据项目:
  • 客户关系管理。例如,一家店铺想要设计一个电子邮件营销活动,因此需要检查客户数据库中的重复客户记录。
  • 合并和收购。 例如,一家银行收购了同一地区的另一家银行,并且两家银行拥有共同的客户。
  • 合规性监管。 例如,一家企业所要遵守的政府或行业法规要求所有数据系统都不包含重复的记录。
  • 财务风险管理。 例如,某家银行可能想要搜索帐户所有者之间的关系。
  • 主数据管理。 例如,一家零售连锁店有一个主客户记录数据库,旗下的每家零售店都定期向主数据库记录提交。
  • 必须标识数据集中的重复记录的任何项目。