目次

Search

  1. はじめに
  2. Informatica Data Engineering Integrationについて
  3. マッピング
  4. マッピングの最適化
  5. ソース
  6. ターゲット
  7. トランスフォーメーション
  8. Pythonトランスフォーメーション
  9. データプレビュー
  10. クラスタワークフロー
  11. プロファイル
  12. 監視
  13. 階層データ処理
  14. 階層データ処理設定
  15. スキーマが変更された階層データの処理
  16. インテリジェント構造モデル
  17. ブロックチェーン
  18. ステートフルコンピューティング
  19. 付録 A: 接続リファレンス
  20. 付録 B: データ型リファレンス
  21. 付録 C: 関数リファレンス

Azure Data Lake Storage Gen2の複合ファイルソース

Azure Data Lake Storage Gen2の複合ファイルソース

Azure Data Lake Storage Gen2データオブジェクトからデータを読み取るには、PowerExchange for HDFSまたはPowerExchange for Microsoft Azure Data Lake Storage Gen2接続を使用します。
PowerExchange for Microsoft Azure Data Lake Storage Gen2接続は、Azure Blobファイルシステム(ABFS)接続の1つです。PowerExchange for Microsoft Azure Data Lake Storage Gen2接続のライセンスがあれば、使用できます。
次の表に、Hadoop環境のAzure Data Lake Storage Gen2内でPowerExchange for Microsoft Azure Data Lake Storage Gen2マッピングが処理できる複合ファイルを示します。
リソース形式
サポートされている形式
サポートされるエンジン
Avro
  • Flat
  • 階層
    1
Spark
インテリジェント構造モデルまたはサンプルファイル
  • フラット
  • 階層
    1
Spark
JSON
  • Flat
  • 階層
    1
Spark
ORC
  • フラット
Spark
Parquet
  • Flat
  • 階層
    1
Spark
1
Sparkエンジンで実行するには、複合ファイル読み取り操作がプロジェクトカラムに対して複合データ型として有効にされている必要があります。
次の表に、Hadoop環境のHDInsightクラスタのAzure Data Lake Storage Gen2内でPowerExchange for HDFS接続が処理できる複合ファイルを示します。
ファイルタイプ
サポートされている形式
サポートされるエンジン
Avro
  • Flat
  • 階層
    1 2
  • Blaze
  • Spark
JSON
  • Flat
    1
  • 階層
    1 2
  • Blaze
  • Spark
ORC
  • Flat
  • Spark
Parquet
  • Flat
  • 階層
    1 2
  • Blaze
  • Spark
1
Blazeエンジンで実行するには、複合ファイルデータオブジェクトがデータプロセッサトランスフォーメーションに接続されている必要があります。
2
Sparkエンジンで実行するには、複合ファイル読み取り操作がプロジェクトカラムに対して複合データ型として有効にされている必要があります。