Die Python-Umwandlung bietet eine Schnittstelle zum Definieren von Umwandlungsfunktionen mithilfe von Python-Code.
Bei Python handelt es sich um eine Sprache, die einfache Syntax sowie dynamische Eingabe und Bindung verwendet und somit ideal geeignet ist, die Produktivität zu steigern oder zu einer schnellen Anwendungsentwicklung beizutragen. Wenn Sie den Python-Code in einer Data Engineering-Zuordnung verwenden, wird der Python-Code in den erzeugten Scala-Code eingebettet, der von der Spark- oder Databricks Spark-Engine zum Verarbeiten umfangreicher, unterschiedlicher und sich schnell ändernder Datensätze ausgeführt wird.
Sie können die Python-Umwandlung auch für maschinelles Lernen verwenden. In der Umwandlung können Sie eine Ressourcendatei angeben, die ein vortrainiertes Modell enthält, und das vortrainierte Modell in den Python-Code laden. Sie können ein vortrainiertes Modell beispielsweise laden, um Eingabedaten zu klassifizieren oder Vorhersagen zu erstellen.
Die Python-Umwandlung kann erst verwendet werden, nachdem Sie die zugehörigen erweiterten Spark-Eigenschaften in den Hadoop- oder Databricks-Verbindungseigenschaften konfiguriert haben. Stellen Sie dann sicher, dass die Worker-Knoten im Cluster eine Python-Installation enthalten.
Weitere Informationen zum Installieren von Python finden Sie im
Data Engineering Integration-Handbuch
.
Sie können die Python-Umwandlung nur auf der Spark- oder Databricks Spark-Engine ausführen. Sie können die Python-Umwandlung nicht in der nativen Umgebung ausführen.
Weitere Informationen zur Python-Umwandlung finden Sie im