目次

Search

  1. はじめに
  2. Informatica Data Engineering Integrationについて
  3. マッピング
  4. マッピングの最適化
  5. ソース
  6. ターゲット
  7. トランスフォーメーション
  8. Pythonトランスフォーメーション
  9. クラスタワークフロー
  10. プロファイル
  11. 監視
  12. 階層データ処理
  13. 階層データ処理設定
  14. スキーマが変更された階層データの処理
  15. ブロックチェーン
  16. インテリジェント構造モデル
  17. ステートフルコンピューティング
  18. 接続
  19. データ型リファレンス
  20. 関数リファレンス

ユーザーガイド

ユーザーガイド

Hadoopの統合

Hadoopの統合

Informaticaドメインでは、異なるHadoopディストリビューションを実行するクラスタに接続できます。Hadoopはオープンソースのソフトウェアフレームワークであり、複数のマシンのクラスタにわたって大規模なデータセットを分散処理できます。サードパーティのソフトウェアクライアントを使用してHadoopクラスタを設定および管理する必要がある場合もあります。
ドメインは、HDFS、HBase、またはHiveなどのHadoop環境でサポートされているデータソースに接続し、ジョブ処理をHadoopクラスタにプッシュできます。クラスタ全体のファイルへの高パフォーマンスアクセスを有効にするために、HDFSソースに接続することができます。また、HDFSに接続するデータウェアハウスであるHiveソースに接続することもできます。
HBaseなどのNoSQLデータベースに接続することもできます。これは、リアルタイムで操作を実行する、Hadoop上のキーと値のペアを含むデータベースです。データ統合サービスは、マッピングジョブをSparkまたはBlazeエンジンにプッシュしたり、プロファイルジョブをHadoop環境のBlazeエンジンにプッシュしたりできます。
Data Engineering Integrationでは、一部のHadoopディストリビューションの複数のバージョンをサポートしています。デフォルトでは、クラスタ設定ウィザードには最新のサポート対象バージョンが設定されています。