目录

Search

  1. 前言
  2. 转换简介
  3. 转换端口
  4. 转换缓存
  5. 地址验证器转换
  6. 汇总器转换
  7. 关联转换
  8. 离散记录异常转换
  9. 大小写转换器转换
  10. 分类器转换
  11. 比较转换
  12. 合并转换
  13. 数据屏蔽转换
  14. 数据处理器转换
  15. 判定转换
  16. 重复记录异常转换
  17. 表达式转换
  18. 筛选器转换
  19. 层次结构到关系转换
  20. Java 转换
  21. Java 转换 API 引用
  22. Java 表达式
  23. 联接器转换
  24. 键生成器转换
  25. 标签创建器转换
  26. 查找转换
  27. 查找缓存
  28. 动态查找缓存
  29. 宏转换
  30. 匹配转换
  31. 字段分析中的匹配转换
  32. 标识分析中的匹配转换
  33. 规范器转换
  34. 合并转换
  35. 解析器转换
  36. Python 转换
  37. 等级转换
  38. 读取转换
  39. 关系到层次结构转换
  40. REST Web 服务使用者转换
  41. 路由器转换
  42. 序列生成器转换
  43. 排序器转换
  44. SQL 转换
  45. 标准创建器转换
  46. 联合转换
  47. 更新策略转换
  48. Web 服务使用者转换
  49. 解析 Web 服务 SOAP 消息
  50. 生成 Web 服务 SOAP 消息
  51. 加权平均值转换
  52. 窗口转换
  53. 写入转换
  54. 附录 , A: 转换分隔符

Developer 转换指南

Developer 转换指南

键生成器转换概览

键生成器转换概览

键生成器转换是一种主动转换,用于根据选定列中的数据值将记录组织成组。 使用该转换可以在将记录传递给匹配转换之前对记录进行分类。
键生成器转换使用分组策略为选定列创建组键。 这些策略是字符串、Soundex 和 NYSIIS。 选定字段中具有通用值的记录具有一个通用的组键值。 匹配转换会将具有通用组键值的记录一起处理。 这样就可以加快匹配转换中的重复项分析。
匹配转换需要执行的比较运算次数随着数据集中的记录数呈指数增长。 这种指数增长可能会占用大量的计算资源。 通过创建组键,键生成器转换可以使匹配转换以较小的组为单位来比较记录,从而缩短了处理时间。
执行字段匹配时,请选择一个可能为匹配提供有用组的列,以便生成组键。 例如,姓氏列可能会提供比名字列更有意义的组键数据。 但是,如果要选择姓氏列在匹配转换中进行重复项分析,则不要使用此列。
键生成器转换还可以为每个记录创建唯一 ID。 进入匹配转换的每个记录都必须包含唯一 ID。 如果数据不存在 ID,则可以使用键生成器转换为数据创建 ID。