目录

Search

  1. 前言
  2. 转换简介
  3. 转换端口
  4. 转换缓存
  5. 地址验证器转换
  6. 汇总器转换
  7. 关联转换
  8. 离散记录异常转换
  9. 大小写转换器转换
  10. 分类器转换
  11. 比较转换
  12. 合并转换
  13. 数据屏蔽转换
  14. 数据处理器转换
  15. 判定转换
  16. 重复记录异常转换
  17. 表达式转换
  18. 筛选器转换
  19. 层次结构到关系转换
  20. Java 转换
  21. Java 转换 API 引用
  22. Java 表达式
  23. 联接器转换
  24. 键生成器转换
  25. 标签创建器转换
  26. 查找转换
  27. 查找缓存
  28. 动态查找缓存
  29. 宏转换
  30. 匹配转换
  31. 字段分析中的匹配转换
  32. 标识分析中的匹配转换
  33. 规范器转换
  34. 合并转换
  35. 解析器转换
  36. Python 转换
  37. 等级转换
  38. 读取转换
  39. 关系到层次结构转换
  40. REST Web 服务使用者转换
  41. 路由器转换
  42. 序列生成器转换
  43. 排序器转换
  44. SQL 转换
  45. 标准创建器转换
  46. 联合转换
  47. 更新策略转换
  48. Web 服务使用者转换
  49. 解析 Web 服务 SOAP 消息
  50. 生成 Web 服务 SOAP 消息
  51. 加权平均值转换
  52. 窗口转换
  53. 写入转换
  54. 附录 , A: 转换分隔符

Developer 转换指南

Developer 转换指南

重复记录异常转换输出端口

重复记录异常转换输出端口

重复记录异常转换具有多个输出组。 默认情况下,转换将重复记录写入
标准输出
组。 转换将潜在匹配项写入
群集数据
组。 可以为唯一记录添加输出组。
可以通过更改
配置
视图上的默认设置更改转换写入输出端口的记录类型。
下表介绍了
标准输出
组的输出端口:
端口
说明
得分
介于 0 和 1 之间的小数值。 确定群集中一个记录和另一记录之间的相似度。
Row_Identifier
记录的唯一标识符。
Cluster_ID
匹配转换向记录分配的群集 ID。
用户定义的端口
源数据字段。
下表介绍了
群集数据
组中的输出端口:
端口
说明
Row_Identifier
记录的唯一标识符。
Sequential_Cluster_ID
确定人工任务中的群集。 工作流使用连续群集 ID 将群集分配给人工任务的实例。
Cluster_ID
确定记录所属的群集。 匹配转换向所有记录分配群集 ID。
得分
介于 0 和 1 之间的小数值。 通过链接到群集的记录标识相似度。
Is_Master
指示记录是否为群集中首选记录的字符串值。 默认情况下,群集中的第一行是首选记录。 值为 Y 或 N。
Workflow_ID
确定任务中记录工作流的 ID。 在工作流外运行映射时,工作流 ID 为 DummyWorkflowID。
用户定义的端口
源数据端口。