目录

Search

  1. 前言
  2. 转换简介
  3. 转换端口
  4. 转换缓存
  5. 地址验证器转换
  6. 汇总器转换
  7. 关联转换
  8. 离散记录异常转换
  9. 大小写转换器转换
  10. 分类器转换
  11. 比较转换
  12. 合并转换
  13. 数据屏蔽转换
  14. 数据处理器转换
  15. 判定转换
  16. 重复记录异常转换
  17. 表达式转换
  18. 筛选器转换
  19. 层次结构到关系转换
  20. Java 转换
  21. Java 转换 API 引用
  22. Java 表达式
  23. 联接器转换
  24. 键生成器转换
  25. 标签创建器转换
  26. 查找转换
  27. 查找缓存
  28. 动态查找缓存
  29. 宏转换
  30. 匹配转换
  31. 字段分析中的匹配转换
  32. 标识分析中的匹配转换
  33. 规范器转换
  34. 合并转换
  35. 解析器转换
  36. Python 转换
  37. 等级转换
  38. 读取转换
  39. 关系到层次结构转换
  40. REST Web 服务使用者转换
  41. 路由器转换
  42. 序列生成器转换
  43. 排序器转换
  44. SQL 转换
  45. 标准创建器转换
  46. 联合转换
  47. 更新策略转换
  48. Web 服务使用者转换
  49. 解析 Web 服务 SOAP 消息
  50. 生成 Web 服务 SOAP 消息
  51. 加权平均值转换
  52. 窗口转换
  53. 写入转换
  54. 附录 , A: 转换分隔符

Developer 转换指南

Developer 转换指南

Python 转换

Python 转换

Python 转换提供了使用 Python 代码定义转换功能的界面。
Python 是一种使用简单语法、动态键入和动态绑定的语言,这使 Python 成为提高工作效率或参与快速应用程序开发的理想选择。在数据工程映射中使用 Python 代码时,Python 代码被嵌入到生成的 Scala 代码中,Spark 或 Databricks Spark 引擎运行该代码来处理大型、多样化和快速变化的数据集。
您还可以使用 Python 转换进行机器学习。在转换中,可以指定包含预训练模型的资源文件,并在 Python 代码中加载预训练模型。例如,可以加载一个预训练模型来对输入数据进行分类或创建预测。
在使用 Python 转换之前,在 Hadoop 连接或 Databricks 连接属性中配置相应的 Spark 高级属性。然后,确保群集上的工作节点包含 Python 的安装。
有关安装 Python 的详细信息,请参阅《
Data Engineering Integration 指南
》。
只能在 Spark 或 Databricks Spark 引擎上运行 Python 转换。不能在本地环境中运行 Python 转换。
有关 Python 转换的详细信息,请参阅《
Data Engineering Integration 用户指南
》。