目录

Search

  1. 前言
  2. 转换简介
  3. 转换端口
  4. 转换缓存
  5. 地址验证器转换
  6. 汇总器转换
  7. 关联转换
  8. 离散记录异常转换
  9. 大小写转换器转换
  10. 分类器转换
  11. 比较转换
  12. 合并转换
  13. 数据屏蔽转换
  14. 数据处理器转换
  15. 判定转换
  16. 重复记录异常转换
  17. 表达式转换
  18. 筛选器转换
  19. 层次结构到关系转换
  20. Java 转换
  21. Java 转换 API 引用
  22. Java 表达式
  23. 联接器转换
  24. 键生成器转换
  25. 标签创建器转换
  26. 查找转换
  27. 查找缓存
  28. 动态查找缓存
  29. 宏转换
  30. 匹配转换
  31. 字段分析中的匹配转换
  32. 标识分析中的匹配转换
  33. 规范器转换
  34. 合并转换
  35. 解析器转换
  36. Python 转换
  37. 等级转换
  38. 读取转换
  39. 关系到层次结构转换
  40. REST Web 服务使用者转换
  41. 路由器转换
  42. 序列生成器转换
  43. 排序器转换
  44. SQL 转换
  45. 标准创建器转换
  46. 联合转换
  47. 更新策略转换
  48. Web 服务使用者转换
  49. 解析 Web 服务 SOAP 消息
  50. 生成 Web 服务 SOAP 消息
  51. 加权平均值转换
  52. 窗口转换
  53. 写入转换
  54. 附录 , A: 转换分隔符

Developer 转换指南

Developer 转换指南

标识匹配分析的流程

标识匹配分析的流程

下面的流程概括了配置匹配转换以进行标识匹配分析所要采取的步骤。 可以定义一个单独使用匹配转换或者使用匹配转换和其他转换的流程。
将匹配转换连接到上游数据对象之前,验证记录是否包含唯一的序列标识符值。 可以使用键生成器转换创建这些值。 执行标识匹配分析时,可以选择性地将输入数据整理成组。
在匹配转换中执行以下步骤:
  1. 指定标识分析作为匹配类型,并指定数据源的数量。
    如果将转换配置为分析两个数据集,请选择一个主数据集。
    使用
    匹配类型
    视图设置数据源的类型和数量。
  2. 标识用来存储索引数据的位置。 该转换可将索引数据写入到临时文件中,或者将索引数据保存到数据库表中。
    使用
    匹配类型
    视图指定索引数据存储。
  3. 定义匹配分析策略。 选择填充和比较算法,并为算法分配一对列。
    填充指出要选择的列对。
    使用
    策略
    视图定义策略。
  4. 指定转换生成匹配分析结果所用的方法。
  5. 设置匹配阈值。 匹配阈值是可以将两个记录标识为彼此重复的最低得分。
    使用
    匹配输出
    视图选择输出方法和匹配阈值。
    可以在匹配转换或加权平均值转换中设置匹配阈值。 如果创建了匹配 Mapplet,请使用加权平均值转换。