目次

Search

  1. はじめに
  2. Informatica Data Engineering Integrationについて
  3. マッピング
  4. マッピングの最適化
  5. ソース
  6. ターゲット
  7. トランスフォーメーション
  8. Pythonトランスフォーメーション
  9. データプレビュー
  10. クラスタワークフロー
  11. プロファイル
  12. 監視
  13. 階層データ処理
  14. 階層データ処理設定
  15. スキーマが変更された階層データの処理
  16. インテリジェント構造モデル
  17. ブロックチェーン
  18. ステートフルコンピューティング
  19. 付録 A: 接続リファレンス
  20. 付録 B: データ型リファレンス
  21. 付録 C: 関数リファレンス

HiveソースHadoop上

HiveソースHadoop上

Hadoop環境で実行するInformaticaのマッピングにHiveソースを含めることができます。
Hadoop環境で実行するマッピングにHiveソースを設定する場合は、次の制限事項を考慮します。
  • Hiveソース定義にUnicode文字が含まれると、マッピングの実行に失敗します。
  • Hiveソースは、リモートクラスタに置くことはできません。リモートクラスタは、マッピングでHadoop接続が参照するマシンのリモートにあるクラスタです。
  • Hiveソースに階層データが含まれている場合は、トランスフォーメーションロジックをソースデータベースにプッシュすることはできません。
  • サードパーティのHive JDBCドライバは、10進データ型に適切な精度と位取りの値を返しません。その結果、10進データ型のHiveテーブルをDeveloper toolにインポートすると、10進データ型の精度は38に、位取りは0に設定されます。Hiveのバージョンに基づいて、次の設定ルールとガイドラインを考慮します。
    • Hive 0.11: Developer toolで、10進データ型の精度と位取りのデフォルト値を受け入れます。
    • Hive 0.12: Developer toolで、10進データ型の精度と位取りのデフォルト値を受け入れます。
    • Cloudera CDH 5.0を使用するHive 0.12: Developer toolで、10進データ型のソースカラムに対する精度フィールドと位取りフィールドを設定できます。
    • Hive 0.13以上: Developer toolで、10進データ型のソースカラムに対する精度フィールドと位取りフィールドを設定できます。
    • Hive 0.14以上: Hiveデータベースの10進データ型で使用される精度と位取りもDeveloper toolに表示されます。
Sparkエンジンで実行されるマッピングに、パーティション化されたHiveソーステーブルとバケット化されたソースを使用できます。