目次

Search

  1. はじめに
  2. Informatica Data Engineering Integrationについて
  3. マッピング
  4. マッピングの最適化
  5. ソース
  6. ターゲット
  7. トランスフォーメーション
  8. Pythonトランスフォーメーション
  9. データプレビュー
  10. クラスタワークフロー
  11. プロファイル
  12. 監視
  13. 階層データ処理
  14. 階層データ処理設定
  15. スキーマが変更された階層データの処理
  16. インテリジェント構造モデル
  17. ブロックチェーン
  18. ステートフルコンピューティング
  19. 付録 A: 接続リファレンス
  20. 付録 B: データ型リファレンス
  21. 付録 C: 関数リファレンス

Hadoopのユーティリティ

Hadoopのユーティリティ

Data Engineering Integrationは、SqoopなどのサードパーティのHadoopユーティリティを使用してデータを効率的に処理します。
Sqoopは、MapReduceプログラムを介してリレーショナルデータベースとHDFSの間でデータを処理するための、Hadoopコマンドラインプログラムです。Sqoopを使用してデータをインポートおよびエクスポートできます。Sqoopを使用するときは、Hadoopクラスタのノードにリレーショナルデータベースのクライアントおよびソフトウェアをインストールする必要はありません。
Sqoopを使用するには、JDBC接続でSqoopプロパティを設定し、Hadoop環境でマッピングを実行する必要があります。JDBC準拠のデータベースに基づくリレーショナルデータオブジェクト、カスタマイズされたデータオブジェクト、および論理データオブジェクトにSqoop接続を設定できます。例えば、次のデータベースに対して、Sqoop接続を設定できます。
  • Aurora
  • Greenplum
  • IBM DB2
  • IBM DB2 for z/OS
  • Microsoft SQL Server
  • Netezza
  • Oracle
  • Teradata
  • Vertica
モデルリポジトリサービスは、JDBCを使用してメタデータをインポートします。データ統合サービスは、Hadoopランタイム環境でマッピングを実行し、Sqoopにジョブ処理をプッシュします。その後、SqoopがHadoopクラスタ内でmap-reduceジョブを作成します。このジョブは、インポートとエクスポートのジョブを同時に実行します。

Sqoop専用コネクタ

Sqoopからマッピングを実行するときは、次の専用コネクタを使用できます。
OraOop
SqoopでOraOopを使用すると、Oracleとの間でデータの読み書きを行うときのパフォーマンスを最適化できます。OraOopは、ネイティブプロトコルを使用してOracleデータベースに接続するOracle用の特殊なSqoopプラグインです。
SparkエンジンでSqoopマッピングを実行するときに、OraOopを設定できます。
Teradata Connector for Hadoop(TDCH)のSqoop専用コネクタ
次のTDCHのSqoop専用コネクタを使用して、Teradataとの間でデータの読み書きを行うことができます。
  • Cloudera Connector Powered by Teradata
  • Hortonworks Connector for Teradata(Teradata Connector for Hadoop提供)
  • MapR Connector for Teradata
これらのコネクタは、Cloudera、Hortonworks、およびMapRがTeradataに提供しているSqoop専用のプラグインです。ネイティブプロトコルを使用して、Teradataデータベースに接続します。
Informaticaは、BlazeエンジンとSparkエンジンで、Cloudera Connector Powered by TeradataとHortonworks Connector for Teradataをサポートしています。BlazeエンジンでのSqoopマッピングを実行するときは、これらのコネクタを設定する必要があります。SqoopマッピングをSparkエンジンで実行すると、デフォルトではデータ統合サービスによってこれらのコネクタが呼び出されます。
Informaticaは、Sparkエンジンで、MapR Connector for Teradataをサポートしています。SqoopマッピングをSparkエンジンで実行すると、デフォルトではデータ統合サービスによってコネクタが呼び出されます。
SqoopでのネイティブTeradataマッピングの実行の詳細については、『
Informatica PowerExchange for Teradata Parallel Transporter APIユーザーガイド
』を参照してください。