目次

Search

  1. はじめに
  2. Informatica Data Engineering Integrationについて
  3. マッピング
  4. マッピングの最適化
  5. ソース
  6. ターゲット
  7. トランスフォーメーション
  8. Pythonトランスフォーメーション
  9. データプレビュー
  10. クラスタワークフロー
  11. プロファイル
  12. 監視
  13. 階層データ処理
  14. 階層データ処理設定
  15. スキーマが変更された階層データの処理
  16. インテリジェント構造モデル
  17. ブロックチェーン
  18. ステートフルコンピューティング
  19. 付録 A: 接続リファレンス
  20. 付録 B: データ型リファレンス
  21. 付録 C: 関数リファレンス

クラスタワークフロープラットフォームのサポート

クラスタワークフロープラットフォームのサポート

クラスタワークフローの機能は、環境とクラウドプラットフォームによって異なります。

Hadoopクラスタ

Azureプラットフォームでは、ADLS Gen2リソースにアクセスするエフェメラルHDInsightクラスタを作成できます。
AWSプラットフォームでは、S3、Redshift、およびSnowflakeリソースにアクセスするエフェメラルAmazon EMRクラスタを作成できます。
Cloudera Altusでは、クラスタワークフローによって自動化されるタスクを実行するコマンドタスクを持つワークフローを作成します。Cloudera Altusでのクラスタ作成の詳細については、Informatica Documentation Portalの記事「How to Create Cloudera Altus Clusters with a Cluster Workflow」を参照してください。

Databricksクラスタ

AzureおよびAWS Databricksプラットフォームでは、Databricksエフェメラルクラスタを設定できます。
必要に応じて、ウォームプールと呼ばれるキャッシュされたVMインスタンスのセットから開始するようにクラスタを設定できます。これらのインスタンスは、エフェメラルクラスタの作成を実行中の状態でスタンバイで待機します。エフェメラルクラスタの終了時に、インスタンスをスタンバイ状態のままにするように選択できます。詳細については、Databricks documentationを参照してください。
エフェメラルDatabricksクラスタのウォームプールの有効化は、クラスタの作成ワークフロータスクの詳細プロパティで行います。