目录

Search

  1. 前言
  2. 转换简介
  3. 转换端口
  4. 转换缓存
  5. 地址验证器转换
  6. 汇总器转换
  7. 关联转换
  8. 离散记录异常转换
  9. 大小写转换器转换
  10. 分类器转换
  11. 比较转换
  12. 合并转换
  13. 数据屏蔽转换
  14. 数据处理器转换
  15. 判定转换
  16. 重复记录异常转换
  17. 表达式转换
  18. 筛选器转换
  19. 层次结构到关系转换
  20. Java 转换
  21. Java 转换 API 引用
  22. Java 表达式
  23. 联接器转换
  24. 键生成器转换
  25. 标签创建器转换
  26. 查找转换
  27. 查找缓存
  28. 动态查找缓存
  29. 匹配转换
  30. 字段分析中的匹配转换
  31. 标识分析中的匹配转换
  32. 规范器转换
  33. 合并转换
  34. 解析器转换
  35. Python 转换
  36. 等级转换
  37. 读取转换
  38. 关系到层次结构转换
  39. REST Web 服务使用者转换
  40. 路由器转换
  41. 序列生成器转换
  42. 排序器转换
  43. SQL 转换
  44. 标准创建器转换
  45. 联合转换
  46. 更新策略转换
  47. Web 服务使用者转换
  48. 解析 Web 服务 SOAP 消息
  49. 生成 Web 服务 SOAP 消息
  50. 加权平均值转换
  51. 窗口转换
  52. 写入转换
  53. 转换分隔符

Developer 转换指南

Developer 转换指南

永久性索引案例研究

永久性索引案例研究

假设您在一家开设了多个分行的零售银行担任数据管理者一职,负责管理所有分行的客户帐户记录的主集,则您可以使用一组索引数据库表来验证客户帐户数据库是否不包含冗余记录或重复记录。
要创建并管理索引数据存储,请执行以下操作:
  • 创建数据存储。
  • 用各个分行提供的最新数据更新数据存储。
    您可以将帐户数据添加到数据存储,或者也可以更新数据存储中的当前数据。
  • 从数据存储中删除过时的记录。
您明白每个操作都可能在数据存储中创建重复记录,因此决定开发一个策略,以便在将分行数据添加到主数据存储数据之前对数据进行分析。您可以使用标识匹配分析来分析分行数据,以及验证数据是否未在数据存储中创建重复标识。您可以对匹配转换配置永久性索引选项,以分析分行数据和数据存储。

开发用于永久性索引数据管理的策略

作为数据管理者,您可以定义指明客户帐户数据存储不能包含重复标识的业务规则。您可以设计一个标识匹配映射,以便在将分行数据添加到数据存储之前对暂存数据库中的数据进行分析。
在以下情况下,将分行数据添加到数据存储的操作会创建重复标识:
  • 分行数据包含重复标识。
  • 分行数据包含同时也存在于索引中的标识。
  • 分行数据包含数据存储中某个标识的较新版本,而该较新版本与索引中的其他标识匹配。
将暂存数据库与数据存储相比较时,请选择可反映分行数据的重复记录状态的永久性索引选项。更新数据存储之前,您可以决定是否要将分行数据与索引数据相比较。
您可以对部分选项启用和禁用匹配分析。启用匹配分析时,您可以分析映射数据或将索引数据存储与映射数据相比较。如果不需要比较数据,则禁用匹配分析。您还可以使用“匹配输出”选项卡上的“匹配”属性,以便在匹配分析时包含或排除特定的数据。

将映射数据源与索引数据存储相比较

要将映射输入数据与索引数据存储相比较而不对数据存储进行任何更改,请选择以下选项:
  • 不更新数据库
映射会将输入数据与索引数据存储相比较,但不会在索引数据存储中添加、删除或更新任何数据。
如果选择此选项,则您不能禁用标识匹配分析。
由于未更新索引数据,因此您不会在存储中创建重复行。从“匹配输出”选项卡上的“匹配”属性中,选择满足数据项目的当前需求的选项。例如,选择
完整
选项。
完整
选项可验证映射数据是否不包含重复项,并验证映射数据是否未将重复项添加到数据存储。
更新数据存储之前,您可以使用此选项将映射数据与数据存储相比较。如果映射输出指示映射数据未将重复项添加到数据存储,则再次运行该映射。再次运行该映射时,请选择此选项以更新数据库。

创建数据存储以及向数据存储添加行

要创建数据存储或向数据存储添加映射数据中的行,请选择以下选项:
  • 使用新的 ID 更新数据库
如果某个行不与数据存储中的行共享序列标识符,则映射会将该行添加到数据存储。映射不会覆盖索引表中的任何行。如果指定空的数据库表,则映射会将所有映射索引数据写入到表中。
如果选择此选项,则可以启用或禁用标识匹配分析。此选项默认启用匹配分析。
由于您未更新索引行,因此请从“匹配输出”选项卡上的“匹配”属性中选择
独占
选项或
部分
选项。如果已在先前的进程中验证了映射数据行的唯一性,请使用
独占
选项。

更新数据存储中的行

要用映射数据更新数据存储中的当前行,请选择以下选项:
  • 更新数据库中的当前 ID
如果数据存储中的当前记录与映射数据中的记录共享序列标识符,则映射会更新该记录。映射不会将任何行添加到索引表。
如果选择此选项,则可以启用或禁用标识匹配分析。此选项默认禁用匹配分析。
由于您未将索引行添加到索引表,因此请从“匹配输出”选项卡上的“匹配”属性中选择
完整
选项。
更新数据存储中的行时,映射源数据和数据存储之间预计会出现重复项。选择
完整
选项可验证您添加到存储中的标识数据是否不与存储中的当前的数据匹配。

从数据存储中删除行

要从数据存储中删除行,请选择以下选项:
  • 从数据库中删除 ID
如果数据存储中的行与映射数据中的记录共享序列标识符,则映射会删除该行。
如果选择此选项,则可以启用或禁用标识匹配分析。此选项默认禁用匹配分析。
从数据存储中删除数据后,存储中行与行之间的关系随即更改。如果存储包含重复标识,则您可以删除群集中某个驱动程序记录或链接记录的数据。或者,您也可以删除匹配对中的最佳匹配项的数据。再次运行映射时,映射可能会生成不同的群集或重复对。如果从不包含重复记录的数据存储中删除行,则您无法更改记录的重复状态。如果您在删除行之后运行映射,映射将为保留在数据集中的标识生成相同的匹配得分。