目录

Search

  1. 前言
  2. 转换简介
  3. 转换端口
  4. 转换缓存
  5. 地址验证器转换
  6. 汇总器转换
  7. 关联转换
  8. 离散记录异常转换
  9. 大小写转换器转换
  10. 分类器转换
  11. 比较转换
  12. 合并转换
  13. 数据屏蔽转换
  14. 数据处理器转换
  15. 判定转换
  16. 重复记录异常转换
  17. 表达式转换
  18. 筛选器转换
  19. 层次结构到关系转换
  20. Java 转换
  21. Java 转换 API 引用
  22. Java 表达式
  23. 联接器转换
  24. 键生成器转换
  25. 标签创建器转换
  26. 查找转换
  27. 查找缓存
  28. 动态查找缓存
  29. 宏转换
  30. 匹配转换
  31. 字段分析中的匹配转换
  32. 标识分析中的匹配转换
  33. 规范器转换
  34. 合并转换
  35. 解析器转换
  36. Python 转换
  37. 等级转换
  38. 读取转换
  39. 关系到层次结构转换
  40. REST Web 服务使用者转换
  41. 路由器转换
  42. 序列生成器转换
  43. 排序器转换
  44. SQL 转换
  45. 标准创建器转换
  46. 联合转换
  47. 更新策略转换
  48. Web 服务使用者转换
  49. 解析 Web 服务 SOAP 消息
  50. 生成 Web 服务 SOAP 消息
  51. 加权平均值转换
  52. 窗口转换
  53. 写入转换
  54. 附录 , A: 转换分隔符

Developer 转换指南

Developer 转换指南

关联转换概览

关联转换概览

关联转换会处理来自匹配转换的输出数据。 它会在分配给不同匹配群集的重复记录之间创建链接,从而使这些记录可以在数据合并和主数据管理操作中相互关联。
关联转换会为一组关联记录中的每行生成一个
AssociationID
值,并将 ID 值写入输出端口。
整合转换会读取来自关联转换的输出。 使用整合转换可基于具有公用关联 ID 值的记录创建一个主记录。
关联转换会在输入端口上接受字符串和数值数据值。 如果添加其他数据类型的输入端口,则转换会将端口数据值转换为字符串。
AssociationID 输出端口会写入整数数据。 如果转换是在早期版本的 Informatica Data Quality 中配置的,则该转换可以在 AssociationID 端口上写入字符串数据。

示例:关联匹配转换输出

下表包含三条记录,这些记录可能标识的是同一个人:
ID
名称
地址
城市
省/自治区/直辖市
邮政编码
SSN
1
David Jones
100 Admiral Ave.
纽约
NY
10547
987-65-4321
2
Dennis Jones
1000 Alberta Ave.
新泽西
NY
-
987-65-4321
3
D. Jones
Admiral Ave.
纽约
NY
10547-1521
-
在匹配转换中定义的重复项分析操作不会将所有三条记录视为彼此重复,原因如下:
  • 如果对姓名和地址数据定义了重复搜索,则记录 1 和 3 会被视为重复,而记录 2 将被省略。
  • 如果对姓名和社会保障号数据定义了重复搜索,则记录 1 和 2 会被视为重复,而记录 3 将被省略。
  • 如果对所有三个属性(姓名、地址和社会保障号)定义了重复搜索,则匹配转换可能不会将其中任何一条记录视为匹配项。
关联转换会将来自不同匹配群集的数据链接在一起,以便具有相同群集 ID 的记录会获得一个公用的 AssociationID 值。 在本示例中,所有三条记录都会获得一个相同的 AssociationID,如下表中所示:
ID
名称
地址
城市
省/自治区/直辖市
邮政编码
SSN
姓名和地址群集 ID
姓名和 SSN 群集 ID
关联 ID
1
David Jones
100 Admiral Ave.
纽约
NY
10547
987-65-4320
1
1
1
2
Dennis Jones
1000 Alberta Ave.
新泽西
NY
-
987-65-4320
2
1
1
3
D. Jones
Alberta Ave.
纽约
NY
10547-1521
-
1
2
1
可以在整合转换中合并重复的记录数据。