目次

Search

  1. はじめに
  2. Informatica Data Engineering Integrationについて
  3. マッピング
  4. マッピングの最適化
  5. ソース
  6. ターゲット
  7. トランスフォーメーション
  8. Pythonトランスフォーメーション
  9. クラスタワークフロー
  10. プロファイル
  11. 監視
  12. 階層データ処理
  13. 階層データ処理設定
  14. スキーマが変更された階層データの処理
  15. ブロックチェーン
  16. インテリジェント構造モデル
  17. ステートフルコンピューティング
  18. 接続
  19. データ型リファレンス
  20. 関数リファレンス

ユーザーガイド

ユーザーガイド

Pythonトランスフォーメーションの概要

Pythonトランスフォーメーションの概要

SparkまたはDatabricks Sparkエンジンで実行されるマッピングでPythonコードを実行するには、Pythonトランスフォーメーションを使用します。
Pythonトランスフォーメーションは、Pythonコードを使用してトランスフォーメーション機能を定義するためのインタフェースを提供します。
Pythonは、シンプルな構文、動的型付け、および動的バインディングを使用する言語であるため、生産性の向上や高速アプリケーション開発を行う場合に最適な選択です。データエンジニアリングマッピングでPythonコードを使用する場合、Pythonコードは生成済みScalaコードに組み込まれます。SparkまたはDatabricks Sparkエンジンは、これを実行して大規模で多様な急速に変化するデータセットを処理します。
Pythonトランスフォーメーションを機械学習に使用することもできます。このトランスフォーメーションでは、トレーニング済みモデル含むリソースファイルを指定して、Pythonコードにトレーニング済みモデルをロードできます。例えば、トレーニング済みモデルをロードして、入力データの分類や予測の作成ができます。
Pythonトランスフォーメーションを使用するには、Hadoop接続またはDatabrick接続プロパティで対応するSpark詳細プロパティを設定します。次に、クラスタの作業ノードにPythonがインストールされていることを確認します。
Pythonのインストールの詳細については、
Data Engineering Integrationガイド
を参照してください。
バージョン10.4.0では、PythonトランスフォーメーションはDatabricks Sparkエンジンでのバッチマッピングのテクニカルプレビューでサポートされます。
評価目的でのテクニカルプレビュー機能はサポートされていますが、保証対象外で本番環境には対応していません。非本番環境でのみ使用することをお勧めします。Informaticaでは、本番環境用に次のリリースでプレビュー機能を導入するつもりですが、市場や技術的な状況の変化に応じて導入しない場合もあります。詳細については、Informaticaグローバルカスタマサポートにお問い合わせください。
データ統合サービスとBlazeエンジンでPythonトランスフォーメーションはサポートされません。