目次

Search

  1. はじめに
  2. Informatica Data Engineering Integrationについて
  3. マッピング
  4. マッピングの最適化
  5. ソース
  6. ターゲット
  7. トランスフォーメーション
  8. Pythonトランスフォーメーション
  9. クラスタワークフロー
  10. プロファイル
  11. 監視
  12. 階層データ処理
  13. 階層データ処理設定
  14. スキーマが変更された階層データの処理
  15. ブロックチェーン
  16. インテリジェント構造モデル
  17. ステートフルコンピューティング
  18. 接続
  19. データ型リファレンス
  20. 関数リファレンス

ユーザーガイド

ユーザーガイド

クラスタワークフロープロセス

クラスタワークフロープロセス

クラスタワークフローを作成するには、管理者と開発者のタスクが必要です。
次の図に、クラスタワークフローを作成、設定、実行するための処理を示します。
この図では、フローチャートが管理者タスクと開発者タスクに分かれています。フローは管理者タスクで始まります。管理者タスクでは、前提条件の確認、クラスタプロビジョニング設定、Hadoop接続の作成を行います。Hadoop接続を作成する前に、Data Lakeサービスプリンシパル証明書の内容を入力する必要があるのは、Azureだけです。次にフローは開発者タスクへ進みます。開発者タスクではワークフローの作成、クラスタタスクの作成、マッピングタスクの作成を行って、必要に応じてクラスタの削除タスクを追加し、最後にワークフローをデプロイして実行します。
クラスタワークフロー開発プロセスには、次のユーザーによるタスクが必要です。
Administrator
  1. インストールを確認します
    。ドメインは、オンプレミスにするか、クラウドプラットフォーム内のものにすることができます。
  2. クラスタプロビジョニング設定を作成します
    。Administrator toolでクラウドプロビジョニング設定を作成します。クラウドプロビジョニング設定には、データ統合サービスがクラウドプラットフォーム上でリソースのアクセスおよび作成に必要なすべての情報が格納されます。
  3. クラスタ接続を作成します
    。クラスタプロビジョニング設定に関連付ける専用のクラスタ接続を作成します。
管理者タスクの詳細については、
Data Engineering管理者ガイド
を参照してください。
ディベロッパー
ディベロッパーは、次のタスクを完了します。
  1. ワークフローとクラスタの作成タスクを作成します。
  2. マッピングタスクと、必要に応じてその他のタスクを作成します。
  3. 処理が完了したときにクラスタとリソースを削除する場合は、クラスタの削除タスクを作成します。
  4. このワークフローをデプロイして実行します。