目次

Search

  1. はじめに
  2. Informatica Data Engineering Integrationについて
  3. マッピング
  4. マッピングの最適化
  5. ソース
  6. ターゲット
  7. トランスフォーメーション
  8. Pythonトランスフォーメーション
  9. データプレビュー
  10. クラスタワークフロー
  11. プロファイル
  12. 監視
  13. 階層データ処理
  14. 階層データ処理設定
  15. スキーマが変更された階層データの処理
  16. インテリジェント構造モデル
  17. ブロックチェーン
  18. ステートフルコンピューティング
  19. 付録 A: 接続リファレンス
  20. 付録 B: データ型リファレンス
  21. 付録 C: 関数リファレンス

クラスタワークフローの概要

クラスタワークフローの概要

クラスタワークフローは、「クラスタの作成」タスクを使ったクラスタの作成を自動化してから、1つ以上のマッピングをそのクラスタ上で実行するワークフローです。クラウドプラットフォームクラスタ上でマッピングや他のタスクを実行するようにクラスタワークフローを作成できます。ワークフロー内でマッピングを実行するためにエファメラルクラスタを使用する場合は、「クラスタの削除」タスクを含めてマッピングの実行後にそのクラスタを終了し、削除します。
クラスタワークフローでは、データ統合サービスとクラウドプラットフォームとの間の通信を可能にする、クラウドプロビジョニング設定やクラスタ接続などのその他の要素が使用されます。
1つのクラスタワークフローには1つのクラスタの作成タスクが含まれ、このタスクは、作成するクラスタに関する情報を使用して設定します。エフェメラルクラスタを作成する場合、クラスタの削除タスクを含められます。エフェメラルクラスタは、マッピングおよびその他のタスクを実行し、タスクが完了したら終了するクラウドプラットフォームクラスタです。クラウドプラットフォームリソースを保存するエフェメラルクラスタを作成します。
クラスタワークフローを使用して、Hadoop環境のMicrosoft AzureまたはAmazon AWSクラウドプラットフォームでHadoopクラスタを作成したり、AzureまたはAWSのDatabricks環境でDatabricksクラスタを作成したりできます。