Developer 转换指南

10.5.2
- 10.5
- 10.4.0
- 10.1.1 HotFix 2
- 10.1.1
- 10.1

上一个下一个

Python 转换

Python 转换提供了使用 Python 代码定义转换功能的界面。

Python 是一种使用简单语法、动态键入和动态绑定的语言，这使 Python 成为提高工作效率或参与快速应用程序开发的理想选择。在数据工程映射中使用 Python 代码时，Python 代码被嵌入到生成的 Scala 代码中，Spark 或 Databricks Spark 引擎运行该代码来处理大型、多样化和快速变化的数据集。

您还可以使用 Python 转换进行机器学习。在转换中，可以指定包含预训练模型的资源文件，并在 Python 代码中加载预训练模型。例如，可以加载一个预训练模型来对输入数据进行分类或创建预测。

在使用 Python 转换之前，在 Hadoop 连接或 Databricks 连接属性中配置相应的 Spark 高级属性。然后，确保群集上的工作节点包含 Python 的安装。

有关安装 Python 的详细信息，请参阅《

Data Engineering Integration 指南

》。

只能在 Spark 或 Databricks Spark 引擎上运行 Python 转换。不能在本地环境中运行 Python 转换。

有关 Python 转换的详细信息，请参阅《

Data Engineering Integration 用户指南

》。

下载指南

发送反馈

社区