目次

Search

  1. はじめに
  2. トランスフォーメーションについて
  3. トランスフォーメーションポート
  4. トランスフォーメーションキャッシュ
  5. アドレスバリデータトランスフォーメーション
  6. アグリゲータトランスフォーメーション
  7. 関連付けトランスフォーメーション
  8. 不良レコードの例外トランスフォーメーション
  9. 大文字小文字変換プログラムトランスフォーメーション
  10. 分類子トランスフォーメーション
  11. 比較トランスフォーメーション
  12. 統合トランスフォーメーション
  13. データマスキングトランスフォーメーション
  14. データプロセッサトランスフォーメーション
  15. ディシジョントランスフォーメーション
  16. 重複レコードの例外トランスフォーメーション
  17. 式トランスフォーメーション
  18. フィルタトランスフォーメーション
  19. 階層型からリレーショナルへのトランスフォーメーション
  20. Javaトランスフォーメーション
  21. JavaトランスフォーメーションAPIのリファレンス
  22. Java式
  23. ジョイナトランスフォーメーション
  24. キージェネレータトランスフォーメーション
  25. ラベラトランスフォーメーション
  26. ルックアップトランスフォーメーション
  27. ルックアップキャッシュ
  28. 動的ルックアップキャッシュ
  29. マクロトランスフォーメーション
  30. 一致トランスフォーメーション
  31. フィールド分析での一致トランスフォーメーション
  32. ID分析での一致トランスフォーメーション
  33. ノーマライザトランスフォーメーション
  34. マージトランスフォーメーション
  35. パーサートランスフォーメーション
  36. Pythonトランスフォーメーション
  37. ランクトランスフォーメーション
  38. 読み取りトランスフォーメーション
  39. リレーショナルから階層型へのトランスフォーメーション
  40. REST Webサービスコンシューマトランスフォーメーション
  41. ルータトランスフォーメーション
  42. シーケンスジェネレータトランスフォーメーション
  43. ソータートランスフォーメーション
  44. SQLトランスフォーメーション
  45. 標準化トランスフォーメーション
  46. 共有体トランスフォーメーション
  47. アップデートストラテジトランスフォーメーション
  48. Webサービスコンシューマトランスフォーメーション
  49. WebサービスSOAPメッセージの解析
  50. WebサービスSOAPメッセージの生成
  51. 加重平均トランスフォーメーション
  52. ウィンドウトランスフォーメーション
  53. 書き込みトランスフォーメーション
  54. 付録 A: トランスフォーメーションの区切り文字

Developerトランスフォーメーションガイド

Developerトランスフォーメーションガイド

Pythonトランスフォーメーション

Pythonトランスフォーメーション

Pythonトランスフォーメーションは、Pythonコードを使用してトランスフォーメーション機能を定義するためのインタフェースを提供します。
Pythonは、シンプルな構文、動的型付け、および動的バインディングを使用する言語であるため、生産性の向上や高速アプリケーション開発を行う場合に最適な選択です。データエンジニアリングマッピングでPythonコードを使用する場合、Pythonコードは生成済みScalaコードに組み込まれます。SparkまたはDatabricks Sparkエンジンは、これを実行して大規模で多様な急速に変化するデータセットを処理します。
Pythonトランスフォーメーションを機械学習に使用することもできます。このトランスフォーメーションでは、トレーニング済みモデル含むリソースファイルを指定して、Pythonコードにトレーニング済みモデルをロードできます。例えば、トレーニング済みモデルをロードして、入力データの分類や予測の作成ができます。
Pythonトランスフォーメーションを使用するには、Hadoop接続またはDatabrick接続プロパティで対応するSpark詳細プロパティを設定します。次に、クラスタの作業ノードにPythonがインストールされていることを確認します。
Pythonのインストールの詳細については、
Data Engineering Integrationガイド
を参照してください。
Pythonトランスフォーメーションは、SparkエンジンまたはDatabricks Sparkエンジンでのみ実行できます。ネイティブ環境でPythonトランスフォーメーションを実行することはできません。
Pythonトランスフォーメーションの詳細については、『
Data Engineering Integrationユーザーガイド
』を参照してください。