目次

Search

  1. はじめに
  2. Informatica Data Engineering Integrationについて
  3. マッピング
  4. マッピングの最適化
  5. ソース
  6. ターゲット
  7. トランスフォーメーション
  8. Pythonトランスフォーメーション
  9. データプレビュー
  10. クラスタワークフロー
  11. プロファイル
  12. 監視
  13. 階層データ処理
  14. 階層データ処理設定
  15. スキーマが変更された階層データの処理
  16. インテリジェント構造モデル
  17. ブロックチェーン
  18. ステートフルコンピューティング
  19. 付録 A: 接続リファレンス
  20. 付録 B: データ型リファレンス
  21. 付録 C: 関数リファレンス

ユーザーガイド

ユーザーガイド

一時ステージングテーブルでのデータ圧縮の有効化

一時ステージングテーブルでのデータ圧縮の有効化

Hadoop環境でマッピングを実行する際のパフォーマンスを最適化するために、一時ステージングテーブルでデータ圧縮を有効にできます。一時ステージングテーブルでデータ圧縮を有効にすると、マッピングパフォーマンスが改善されることがあります。
一時ステージングテーブルでデータ圧縮を有効にするには、次の手順を実行します。
  1. 一時ステージングテーブルでの圧縮を有効にするために、Hadoopクラスタが使用するコーデッククラス名を使用するようにHadoop接続を設定します。
  2. 一時ステージングテーブルで圧縮を有効にするようにHadoopクラスタを設定します。
Hadoopは、次の圧縮コーデッククラス名に対して、次の圧縮ライブラリを提供します。
圧縮ライブラリ
コーデッククラス名
パフォーマンスの推奨事項
Zlib
org.apache.hadoop.io.compress.DefaultCodec
なし
Gzip
org.apache.hadoop.io.compress.GzipCodec
なし
Snappy
org.apache.hadoop.io.compress.SnappyCodec
最適なパフォーマンスで推奨。
Bz2
org.apache.hadoop.io.compress.BZip2Codec
非推奨。パフォーマンスが低下。
LZO
com.hadoop.compression.lzo.LzoCodec
なし