ユーザーガイド

前へ次へ

Sparkエンジン上のランタイム処理

データ統合サービスは、HadoopクラスタでSparkエンジンを使用して、モデルリポジトリマッピングを実行できます。

Sparkエンジンでマッピングを実行するために、データ統合サービスはマッピングアプリケーションをSpark実行プログラムに送信します。Spark実行プログラムは、ジョブを実行するためにHadoopクラスタに送信します。

次の図は、HadoopクラスタがSpark実行プログラムから送信されたジョブをどのように処理するかを示しています。

データ統合サービスがSparkエンジンでマッピングを実行すると、次のイベントが発生します。

論理Data TransformationマネージャがマッピングをScalaプログラムに変換し、アプリケーションとしてパッケージ化して、Spark実行プログラムに送信します。

Spark実行プログラムがこのアプリケーションをHadoopクラスタ内のリソースマネージャに送信し、アプリケーションを実行するためのリソースを要求します。

HDInsightクラスタでマッピングを実行すると、Spark実行プログラムがspark-submitスクリプトを起動します。このスクリプトが、アプリケーションを実行するためのリソースを要求します。

リソースマネージャが、リソースを提供できるノードマネージャを識別し、ジョブをデータノードに割り当てます。

Sparkアプリケーションが実行されるデータノードで、ドライバプロセスと実行プログラムプロセスが起動されます。

ページをウォッチ

フィードバックを送信