目录

Search

  1. 前言
  2. 转换简介
  3. 转换端口
  4. 转换缓存
  5. 地址验证器转换
  6. 汇总器转换
  7. 关联转换
  8. 离散记录异常转换
  9. 大小写转换器转换
  10. 分类器转换
  11. 比较转换
  12. 合并转换
  13. 数据屏蔽转换
  14. 数据处理器转换
  15. 判定转换
  16. 重复记录异常转换
  17. 表达式转换
  18. 筛选器转换
  19. 层次结构到关系转换
  20. Java 转换
  21. Java 转换 API 引用
  22. Java 表达式
  23. 联接器转换
  24. 键生成器转换
  25. 标签创建器转换
  26. 查找转换
  27. 查找缓存
  28. 动态查找缓存
  29. 匹配转换
  30. 字段分析中的匹配转换
  31. 标识分析中的匹配转换
  32. 规范器转换
  33. 合并转换
  34. 解析器转换
  35. Python 转换
  36. 等级转换
  37. 读取转换
  38. 关系到层次结构转换
  39. REST Web 服务使用者转换
  40. 路由器转换
  41. 序列生成器转换
  42. 排序器转换
  43. SQL 转换
  44. 标准创建器转换
  45. 联合转换
  46. 更新策略转换
  47. Web 服务使用者转换
  48. 解析 Web 服务 SOAP 消息
  49. 生成 Web 服务 SOAP 消息
  50. 加权平均值转换
  51. 窗口转换
  52. 写入转换
  53. 转换分隔符

Developer 转换指南

Developer 转换指南

何时使用解析器转换

何时使用解析器转换

如果某个列中的数据字段包含多个类型的信息,则要将字段值移动到新列,请使用解析器转换。 解析器转换可以为数据集中每种类型的信息创建一个新列。
以下示例介绍了可以使用解析器转换执行的一些结构更改类型:
为联系人数据创建新列
可以创建一个数据结构,将单个列中的姓名数据解析为多个列。 例如,可以创建称呼列、名字列、中间名列和姓氏列。
可以使用一个概率模型配置转换,该模型表示输入端口上的人名结构。 可以使用一个输入端口数据样本定义该模型。
可以创建一个标志解析策略,以便将该概率模型应用于输入端口,并将姓名值写入新列。 此转换会根据输入字符串中每个值的位置以及该值所代表的姓名类型将姓名值写入新列。
还可以使用基于模式的解析策略来解析联系人数据。 配置基于模式的解析策略时,可定义表示输入端口上的姓名结构的模式。
创建地址列
可以创建一个数据结构,以便将一个地址数据列解析为多个列,以描述可传递地址。
为此转换配置引用表,这些表包含可识别的地址元素(例如,邮政编码、省/自治区/直辖市名称和城市名称)。 创建一个标志解析策略,以便将每个地址元素写入一个新端口。
您无法使用引用表解析输入字符串中的街道地址数据,因为街道名称和编号数据过于宽泛,无法从引用表中捕获。 但是,可以使用“溢出”端口捕获该数据。 在解析了某一地址中所有城市、省/自治区/直辖市和邮政编码数据后,剩余数据将包含街道信息。
例如,使用一个标志解析策略,将以下地址拆分成多个地址元素:
123 MAIN ST NW STE 12 ANYTOWN NY 12345
此解析策略可以将这些地址元素写入以下列:
列名
数据
溢出
123 MAIN ST NW STE 12
城市
ANYTOWN
省/自治区/直辖市
NY
邮政编码
12345
创建产品数据列
可以创建一个数据结构,以便将单个产品数据列解析为多个列,以描述产品清单明细。
为此转换配置标志集,这些标志集包含多个清单元素(例如,尺寸、颜色和重量)。 创建一个标志解析策略,以便将每个清单元素写入一个新端口
例如,使用标志解析策略,将以下上色说明拆分成单独的清单元素:
500ML Red Matt Exterior
此解析策略可以将这些地址元素写入以下列:
列名
数据
大小
500ML
颜色
红色
样式
Matt
外部
Y