目录

Search

  1. 前言
  2. 转换简介
  3. 转换端口
  4. 转换缓存
  5. 地址验证器转换
  6. 汇总器转换
  7. 关联转换
  8. 离散记录异常转换
  9. 大小写转换器转换
  10. 分类器转换
  11. 比较转换
  12. 合并转换
  13. 数据屏蔽转换
  14. 数据处理器转换
  15. 判定转换
  16. 重复记录异常转换
  17. 表达式转换
  18. 筛选器转换
  19. 层次结构到关系转换
  20. Java 转换
  21. Java 转换 API 引用
  22. Java 表达式
  23. 联接器转换
  24. 键生成器转换
  25. 标签创建器转换
  26. 查找转换
  27. 查找缓存
  28. 动态查找缓存
  29. 匹配转换
  30. 字段分析中的匹配转换
  31. 标识分析中的匹配转换
  32. 规范器转换
  33. 合并转换
  34. 解析器转换
  35. Python 转换
  36. 等级转换
  37. 读取转换
  38. 关系到层次结构转换
  39. REST Web 服务使用者转换
  40. 路由器转换
  41. 序列生成器转换
  42. 排序器转换
  43. SQL 转换
  44. 标准创建器转换
  45. 联合转换
  46. 更新策略转换
  47. Web 服务使用者转换
  48. 解析 Web 服务 SOAP 消息
  49. 生成 Web 服务 SOAP 消息
  50. 加权平均值转换
  51. 窗口转换
  52. 写入转换
  53. 转换分隔符

Developer 转换指南

Developer 转换指南

标识匹配类型属性

标识匹配类型属性

您可以使用“匹配类型”视图指定匹配转换执行的分析类型,以及设置用于定义分析的属性。您可以指定单源分析或双源分析,还可为标识索引数据指定永久性数据存储。
应配置的属性取决于所选分析类型。其中许多选项是所有分析类型共用的。

共同属性

以下属性是所有分析类型共用的:
填充
标识转换使用的填充文件。填充文件包含生成索引键的键构建算法。
键级别
确定标识算法生成的键的数量。默认设置为
标准
受限
设置将导致键数量减少,准确性提高,但处理时间延长。
扩展
设置将导致键数量增加,准确性降低,但处理时间会缩短。
键类型
描述键字段包含的信息类型。标识分析可以针对人员姓名、组织和地址生成键。选择最能反映您在
键字段
属性上所指定列的键类型。
搜索级别
指示转换应用于匹配分析的搜索深度和搜索速度之间的平衡。搜索深度与返回的匹配项数量成反比。例如,
完全
选项返回的匹配数较少。
键字段
指定匹配转换用于生成索引键数据的列。 验证所选列是否包含在
键类型
属性上指定的信息类型。
索引目录
标识数据集成服务向其中写入当前转换的索引键数据的目录。默认情况下,该属性为空。如果未指定索引目录,数据集成服务将使用您在内容管理服务上设置的位置。
您可以输入目录的路径,也可以使用参数识别该目录。指定数据集成服务计算机上的本地路径。数据集成服务必须能够写入此目录。
缓存目录
指出数据集成服务在标识匹配分析的索引创建阶段向其中写入临时数据的目录。更新该属性为当前转换的数据指定位置。默认情况下,该属性为空。如果未指定缓存目录,数据集成服务将使用您在内容管理服务上设置的位置。
您可以输入目录的路径,也可以使用参数识别该目录。指定数据集成服务计算机上的本地路径。数据集成服务必须能够写入此目录。
缓存大小
确定数据集成服务分配给标识索引创建的系统内存量。默认值为 400,000 字节。
如果索引创建操作生成的数据较多,数据集成服务会将超出的数据写入缓存目录。如果操作所需的内存超出系统内存和文件存储可以提供的内存,映射将失败。
如果输入 65536 或更高的值,转换将以字节为单位读取值。如果输入低一些的值,转换将以 MB 为单位读取值。

双源属性

将转换配置用于双源分析时,您应设置共同属性和以下属性:
主数据集
标识包含主数据的数据源。指定双源分析中的主数据集。

永久性数据存储属性

将转换配置为使用永久性索引数据存储时,您应设置共同属性和以下属性:
持久性方法
指定转换是否使用来自映射数据源的索引数据更新当前的索引表。选择以下选项之一:
  • 使用新的 ID 更新数据库。
    转换会将所有不会导致索引数据中出现重复序列标识符的行添加到索引数据中。转换不会更新索引中的当前行。
    默认情况下,如果选择此选项,则转换将执行匹配分析。您可以使用“匹配进程”选项来启用或禁用匹配分析。
  • 不更新数据库。
    转换不会使用映射数据源的索引数据更新索引表。
    如果选择此选项,则转换将执行匹配分析。
  • 从数据库中删除 ID。
    如果索引表中的行与映射源数据中的行共享序列标识符,则转换会删除索引表中的这些行。
    如果选择此选项,则转换不会执行匹配分析。
  • 更新数据库中的当前 ID。
    如果索引表中的行与映射源数据中的行共享序列标识符,则转换会将索引表中的行替换为映射源数据中的行。转换不会向索引添加行。
    默认情况下,如果选择此选项,则转换将执行匹配分析。您可以使用“匹配进程”选项来启用或禁用匹配分析。
默认的持久性方法为
使用新的 ID 更新数据库
匹配进程
确定当前转换是否执行标识分析。
在“持久性方法”属性上选择的选项决定了“匹配进程”属性上的选项。
数据库连接
标识包含索引表的数据库。
永久性存储
标识指定数据库中的索引表。