目录

Search

  1. 前言
  2. 转换简介
  3. 转换端口
  4. 转换缓存
  5. 地址验证器转换
  6. 汇总器转换
  7. 关联转换
  8. 离散记录异常转换
  9. 大小写转换器转换
  10. 分类器转换
  11. 比较转换
  12. 合并转换
  13. 数据屏蔽转换
  14. 数据处理器转换
  15. 判定转换
  16. 重复记录异常转换
  17. 表达式转换
  18. 筛选器转换
  19. 层次结构到关系转换
  20. Java 转换
  21. Java 转换 API 引用
  22. Java 表达式
  23. 联接器转换
  24. 键生成器转换
  25. 标签创建器转换
  26. 查找转换
  27. 查找缓存
  28. 动态查找缓存
  29. 匹配转换
  30. 字段分析中的匹配转换
  31. 标识分析中的匹配转换
  32. 规范器转换
  33. 合并转换
  34. 解析器转换
  35. Python 转换
  36. 等级转换
  37. 读取转换
  38. 关系到层次结构转换
  39. REST Web 服务使用者转换
  40. 路由器转换
  41. 序列生成器转换
  42. 排序器转换
  43. SQL 转换
  44. 标准创建器转换
  45. 联合转换
  46. 更新策略转换
  47. Web 服务使用者转换
  48. 解析 Web 服务 SOAP 消息
  49. 生成 Web 服务 SOAP 消息
  50. 加权平均值转换
  51. 窗口转换
  52. 写入转换
  53. 转换分隔符

Developer 转换指南

Developer 转换指南

主数据分析

主数据分析

在匹配转换中分析两个数据源时,必须将其中一个源标识为主数据集。 转换会将所指定的数据集中每条记录的数据值与第二个数据集的每个记录中的相应值进行比较。
在许多组织中,主数据集构成永久的高质量数据存储。 向主数据集添加记录之前,请使用匹配转换确认记录不会向主数据中添加重复信息。

主数据示例

一家银行需要维护客户账户记录的主数据集。 这家银行每天都会将用于标识新客户账户的记录更新到主数据集中。 银行使用重复分析映射来确认新记录与主数据集中的客户信息不重复。 主数据集和新账户表具有通用结构,但这些表使用类型相同的数据库。 因此,每次需要更新主数据集时,银行都可以重用重复分析映射。

主数据集分析的方向性

匹配转换在单个方向上比较两个数据集中的记录。 该转换会将主数据集中的每个记录与第二个数据集中的所有记录相比较, 但不将第二个数据集中的每个记录与主数据集中的所有记录相比较。 因此,主数据集的选择会影响匹配分析的结果。
下表显示可在标识匹配分析中比较的两个数据集:
数据集 1
数据集 2
Alex Bell
Alexander Bell
Alexander Graham Bell
Thomas Edison
Alva Edison
Nicola Tesla
Marie Curie
Irene Joliot Curie
Dorothy Crowfoot
Dorothy Hodgkin
如果选择数据集 1 作为主数据集且选择
最佳匹配
输出选项,输出将包括以下记录:
  • Alex Bell、Alexander Bell
  • Alexander Graham Bell、Alexander Bell
如果选择数据集 2 作为主数据集且选择
最佳匹配
输出选项,输出将包括以下记录:
  • Alexander Bell、Alex Bell
数据集 2 为主数据集时,该转换无法匹配 Alexander Bell 和 Alexander Graham Bell,因为 Alexander Bell 已匹配输出数据中的 Alex Bell。