Use a transformação Python para executar o código Python em um mapeamento executado no Mecanismo Spark.
A transformação de Python é uma transformação passiva que fornece uma interface para definir a funcionalidade de transformação usando o código Python. Você faz referência ao código Python e aos arquivos de recursos que você usa no código Python na transformação de Python.
Você pode usar uma transformação de Python para implementar um modelo de máquina nos dados transmitidos para a transformação. Por exemplo, você pode usar a transformação de Python para gravar o código Python que carrega um modelo pré-treinado. Você pode usar o modelo pré-treinado para classificar dados de entrada ou criar previsões.
Antes de poder usar a transformação de Python, você deve instalar o Python na máquina do Serviço de Integração de Dados e configurar as propriedades avançadas do Spark correspondentes na conexão do Hadoop.
Para obter mais informações sobre como instalar o Python, consulte
Guia de Integração do Informatica Big Data Management