目次

Search

  1. はじめに
  2. Informatica Data Engineering Integrationについて
  3. マッピング
  4. マッピングの最適化
  5. ソース
  6. ターゲット
  7. トランスフォーメーション
  8. Pythonトランスフォーメーション
  9. クラスタワークフロー
  10. プロファイル
  11. 監視
  12. 階層データ処理
  13. 階層データ処理設定
  14. スキーマが変更された階層データの処理
  15. ブロックチェーン
  16. インテリジェント構造モデル
  17. ステートフルコンピューティング
  18. 接続
  19. データ型リファレンス
  20. 関数リファレンス

ユーザーガイド

ユーザーガイド

Pythonコード

Pythonコード

PythonコードでPythonトランスフォーメーションのデータ処理方法を定義します。Pythonコードを記述するときは、入力変数を再構築し、トレーニング済みのモデルをロードし、出力変数を定義して、追加のトランスフォーメーション機能を定義します。
Pythonコードを記述するときは、次のタブを使用します。
入力前
[入力前]タブで、1度だけ解釈して、データのすべての行で共有するコードを定義します。
[入力前]タブを使用して、次のタスクを実行します。
  • import文の宣言。
  • 変数の宣言。
  • 変数の初期化。
  • ヘルパーメソッドの定義。
入力時
[入力時]タブでは、パーティションの処理中に入力行を受信したときのPythonトランスフォーメーションの動作を定義します。各パーティションとその行それぞれについて、Pythonトランスフォーメーションは[入力時]タブのコードを処理します。
最後
[最後]タブでは、パーティション内のすべての入力データを処理した後のPythonトランスフォーメーションの動作を定義します。generateRow()メソッドを呼び出して、パーティションの出力行を生成することもできます。

Pythonコードを記述するためのガイドライン

Pythonコードを記述するときは次のルールを使用します。
  • 使用する前に変数を定義します。例えば、変数が[入力時]タブで定義されると、[入力前]タブでその変数は参照できません。
  • 入力ポートにアクセスするには、入力ポート名を呼び出します。
  • 出力ポートを設定するには、出力ポートに値を設定します。Pythonトランスフォーメーションで定義する出力ポートごとに、値を設定する必要があります。
  • トランスフォーメーションで入力ポートから出力ポートにデータを書き込む方法を定義するには、出力ポートに入力ポートの値を設定します。
    例えば、
    output_port = input_port
    と記述すると、入力ポート
    input_port
    から出力ポート
    output_port
    にデータを書き込みます。
  • リソースファイルにアクセスするには、
    resourceFilesArray
    変数を使用します。リソースファイルを指定するときは、
    resourceFilesArray[0]
    のようにインデックスを使用します。
  • Pythonトランスフォーメーションを実行するときに、データ統合サービスはPythonコードを検証しません。