目录

Search

  1. 前言
  2. 转换简介
  3. 转换端口
  4. 转换缓存
  5. 地址验证器转换
  6. 汇总器转换
  7. 关联转换
  8. 离散记录异常转换
  9. 大小写转换器转换
  10. 分类器转换
  11. 比较转换
  12. 合并转换
  13. 数据屏蔽转换
  14. 数据处理器转换
  15. 判定转换
  16. 重复记录异常转换
  17. 表达式转换
  18. 筛选器转换
  19. 层次结构到关系转换
  20. Java 转换
  21. Java 转换 API 引用
  22. Java 表达式
  23. 联接器转换
  24. 键生成器转换
  25. 标签创建器转换
  26. 查找转换
  27. 查找缓存
  28. 动态查找缓存
  29. 匹配转换
  30. 字段分析中的匹配转换
  31. 标识分析中的匹配转换
  32. 规范器转换
  33. 合并转换
  34. 解析器转换
  35. Python 转换
  36. 等级转换
  37. 读取转换
  38. 关系到层次结构转换
  39. REST Web 服务使用者转换
  40. 路由器转换
  41. 序列生成器转换
  42. 排序器转换
  43. SQL 转换
  44. 标准创建器转换
  45. 联合转换
  46. 更新策略转换
  47. Web 服务使用者转换
  48. 解析 Web 服务 SOAP 消息
  49. 生成 Web 服务 SOAP 消息
  50. 加权平均值转换
  51. 窗口转换
  52. 写入转换
  53. 转换分隔符

Developer 转换指南

Developer 转换指南

匹配得分计算

匹配得分计算

匹配得分是表示两个列值之间相似度的数值。 通过某种算法计算匹配得分,并以一个介于 0 到 1 之间的小数值表示。 如果两列值完全相同,算法将分配得分 1。
如果选择多个列对进行分析,转换将根据选定列中的得分计算平均得分。 默认情况下,转换会为每个列对的得分分配相等的权重。 转换不会推理数据集中列数据的相对重要性。
您可以编辑转换用于计算匹配得分的权重值。 如果要为数据集中的列分配较高或较低的优先级,请编辑权重值。
还可以设置当转换在列中发现空值时要应用的得分。 默认情况下,转换会将空值视为数据错误,并为包含空值的任何值对分配较低的匹配得分。
选定的算法将确定两个值之间的匹配得分。 算法将为两个值生成一个得分。 匹配得分并不取决于您选择的匹配输出类型或计分方法类型。