目录

Search

  1. 前言
  2. 转换简介
  3. 转换端口
  4. 转换缓存
  5. 地址验证器转换
  6. 汇总器转换
  7. 关联转换
  8. 离散记录异常转换
  9. 大小写转换器转换
  10. 分类器转换
  11. 比较转换
  12. 合并转换
  13. 数据屏蔽转换
  14. 数据处理器转换
  15. 判定转换
  16. 重复记录异常转换
  17. 表达式转换
  18. 筛选器转换
  19. 层次结构到关系转换
  20. Java 转换
  21. Java 转换 API 引用
  22. Java 表达式
  23. 联接器转换
  24. 键生成器转换
  25. 标签创建器转换
  26. 查找转换
  27. 查找缓存
  28. 动态查找缓存
  29. 匹配转换
  30. 字段分析中的匹配转换
  31. 标识分析中的匹配转换
  32. 规范器转换
  33. 合并转换
  34. 解析器转换
  35. Python 转换
  36. 等级转换
  37. 读取转换
  38. 关系到层次结构转换
  39. REST Web 服务使用者转换
  40. 路由器转换
  41. 序列生成器转换
  42. 排序器转换
  43. SQL 转换
  44. 标准创建器转换
  45. 联合转换
  46. 更新策略转换
  47. Web 服务使用者转换
  48. 解析 Web 服务 SOAP 消息
  49. 生成 Web 服务 SOAP 消息
  50. 加权平均值转换
  51. 窗口转换
  52. 写入转换
  53. 转换分隔符

Developer 转换指南

Developer 转换指南

分类器转换概览

分类器转换概览

分类器转换是一种被动转换,可分析输入字段并标识每个字段中的信息类型。 如果输入字段包含多个文本值,请使用分类器转换。
配置分类器转换时,请选择分类器模型和分类器算法。 分类器模型是一种引用数据对象。 分类器算法是一组规则,用于计算某个字符串中相似单词的数量以及这些单词的相对位置。 该转换会将算法分析结果与分类器模型的内容进行比较。 该转换将返回标识字符串中主要信息类型的模型分类。
分类器转换可以分析很长的字符串。 例如,可以使用转换来对电子邮件、社交媒体消息和文档文本的内容进行分类。 可以将每个文档或消息的内容传递到数据源列的某个字段中,然后将该列连接到分类器转换。 在每种情况下,您都可以对数据源进行合理准备,以使每个字段都包含要分析的完整文档或字符串内容。