目次

Search

  1. はじめに
  2. トランスフォーメーション
  3. ソーストランスフォーメーション
  4. ターゲットトランスフォーメーション
  5. アクセスポリシートランスフォーメーション
  6. B2B Data Transformation
  7. アグリゲータトランスフォーメーション
  8. クレンジングトランスフォーメーション
  9. データマスキングトランスフォーメーション
  10. データサービストランスフォーメーション
  11. 重複排除トランスフォーメーション
  12. 式トランスフォーメーション
  13. フィルタトランスフォーメーション
  14. 階層ビルダートランスフォーメーション
  15. 階層パーサートランスフォーメーション
  16. 階層プロセッサトランスフォーメーション
  17. 入力トランスフォーメーション
  18. Javaトランスフォーメーション
  19. JavaトランスフォーメーションAPIリファレンス
  20. ジョイナトランスフォーメーション
  21. ラベラトランスフォーメーション
  22. ルックアップトランスフォーメーション
  23. 機械学習トランスフォーメーション
  24. マップレットトランスフォーメーション
  25. ノーマライザトランスフォーメーション
  26. 出力トランスフォーメーション
  27. 解析トランスフォーメーション
  28. Pythonトランスフォーメーション
  29. ランクトランスフォーメーション
  30. ルータトランスフォーメーション
  31. ルール仕様トランスフォーメーション
  32. シーケンスジェネレータトランスフォーメーション
  33. ソータートランスフォーメーション
  34. SQLトランスフォーメーション
  35. 構造パーサートランスフォーメーション
  36. トランザクション制御トランスフォーメーション
  37. 共有体トランスフォーメーション
  38. Velocityトランスフォーメーション
  39. ベリファイヤトランスフォーメーション
  40. Webサービストランスフォーメーション

トランスフォーメーション

トランスフォーメーション

リソースファイル

リソースファイル

Pythonトランスフォーメーションでは、リソースファイルとPythonコードを使用して、トランスフォーメーション機能を定義します。トレーニング済みモデルを使用する場合は、そのトレーニング済みモデルをリソースファイルとしてPythonトランスフォーメーションで指定します。
Pythonトランスフォーメーションには次のコンポーネントがあります。
リソースファイル
Pythonコードでアクセスするリソースが含まれるファイル。
このファイルは、
データ統合
の外部で大規模なデータセットに対してトレーニングしたトレーニング済みモデルにすることができます。トレーニング済みモデルを使用してデータを分類したり、Pythonトランスフォーメーションに渡すデータに基づいて予測を作成したりすることができます。トレーニング済みモデルにはPythonコードからアクセスします。
ランタイム環境
ランタイム環境のタイプに基づいてリソースファイルを追加します。Pythonコードでリソースファイルを参照する場合は、リソースファイルを同じディレクトリに追加します。一貫性を維持するため、python_resourcesという名前の専用フォルダにリソースファイルを保存できます。
次のガイドラインを考慮します。
  • Secure Agentマシンが予期せず停止してエージェントが別のマシンで再起動した場合は、新しいマシンの同じディレクトリにPythonインストールおよびリソースファイルを追加する必要があります。
  • Secure AgentマシンでPythonインストールまたはリソースファイルを更新した場合は、次に詳細モードでジョブを実行したときにファイルが有効になります。
  • 長時間実行するジョブの失敗を防ぐために、Secure Agentマシン上のファイルはジョブの実行中に5回以上更新しないようにしてください。
サーバーレスランタイム環境
補足ファイルの場所にリソースファイルを追加します。
Pythonインストールファイルまたはリソースファイルを更新した場合、変更を有効にするにはサーバーレスランタイム環境を再デプロイする必要があります。
補足ファイルの場所の詳細については、「Administrator」のヘルプにある「
Administrator
」を参照してください。
Pythonコード
Pythonトランスフォーメーションが、トランスフォーメーションに渡すデータを処理するために使用するPythonコード。Pythonコードを記述するときは、入力変数を再構築するか、トレーニング済みのモデルをロードするか、出力変数を定義します。