ユーザーガイド

前へ次へ

Databricks Sparkエンジン上のランタイム処理

Databricks Sparkエンジンでジョブを実行する場合、データ統合サービスが処理をDatabricksクラスタにプッシュし、Databricks Sparkエンジンがジョブを実行します。

次の図は、Informatica環境とDatabricks環境のコンポーネントを示しています。

論理Data TransformationマネージャがマッピングをScalaプログラムに変換し、アプリケーションとしてパッケージ化して、データ統合サービスマシン上のDatabricksエンジン実行プログラムに送信します。

Databricksエンジン実行プログラムは、REST APIを介して、アプリケーションをDatabricksクラスタに送信し、アプリケーションの実行を要求して、ランタイム中のアクセスのためにファイルをステージングします。

Databricksクラスタは、ドライバノード上のDatabricks Sparkドライバに要求を渡します。

Databricks Sparkドライバは、ワーカーノードにある1つ以上のDatabricks Spark実行プログラムにジョブを分散します。

実行プログラムはジョブを実行し、ワークスペースのDatabricks File System（DBFS）にランタイムデータをステージングします。

ページをウォッチ

フィードバックを送信