目次

Search

  1. はじめに
  2. Informatica Big Data Managementの概要
  3. マッピング
  4. ソース
  5. ターゲット
  6. トランスフォーメーション
  7. クラスタワークフロー
  8. プロファイル
  9. 監視
  10. 階層データ処理
  11. 階層データ処理設定
  12. スキーマが変更された階層データの処理
  13. インテリジェント構造モデル
  14. ステートフルコンピューティング
  15. 接続
  16. データ型リファレンス
  17. 関数リファレンス

ユーザーガイド

ユーザーガイド

非ネイティブ環境でのマッピングのトラブルシューティング

非ネイティブ環境でのマッピングのトラブルシューティング

非ネイティブ環境でのマッピングのトラブルシューティングのヒントを考慮します。

Hadoop環境

別のクラスタ上のHiveソースまたはHiveターゲットでマッピングを実行すると、データ統合サービスで次のエラーが発生して、Hadoopへのマッピングのプッシュに失敗する:
[exec0_query_6]が原因で、クエリの実行に失敗しました。エラーコード[10]、エラーメッセージ: [FAILED: セマンティック分析のエラー: 行1:181 テーブルが見つかりませんcustomer_eur]、およびSQL状態[42000]]。
Hadoop環境でマッピングを実行する場合は、Hiveソース/ターゲットに対して選択したHive接続とマッピングが同じHiveメタストア上にある必要があります。
SQLオーバーライドとマッピングを並列実行すると、マッピングがハングする。
クラスタが異なるエンジン間で共有されているため、使用可能なリソースが不十分です。
BlazeエンジンとSparkエンジンとで別々のYARNスケジューラキューを使用し、該当するエンジン経由でHiveServer2がSQLオーバーライドを実行できるようにします。
Blazeエンジン上で実行されるマッピングが失敗し、次のプリエンプションエラーメッセージが出力される。
2018-09-27 11:05:27.208 INFO: Container completion status: id [container_e135_1537815195064_4755_01_000012]; state [COMPLETE]; diagnostics [Container preempted by scheduler]; exit status [-102].. 2018-09-27 11:05:27.208 SEVERE: Service [OOP_Container_Manager_Service_2] has stopped running..
Blazeエンジンでは、Capacity SchedulerやFair SchedulerでのYARNプリエンプションはサポートしません。Blazeエンジンに割り当てられたキューでのプリエンプションを無効にするようHadoop管理者に依頼してください。詳細については、Mappings Fail with Preemption Errorsを参照してください。
パーティション化されたHiveテーブルを作成するようマッピングを設定した場合、マッピングが失敗し、宛先テーブルがパーティション化されているためパーティションカラムを指定する必要があることを示すエラーが表示される。
この問題は、Hiveパーティション化テーブルを作成するために設計されたクエリに対する、Informaticaの内部要件が原因で発生します。詳細と回避策については、Knowledge Base article 516266を参照してください。

Databricks環境

マッピングが次のエラーで失敗する:
SEVERE: ID [1857]での実行が状態[INTERNAL_ERROR]、エラーメッセージ[ライブラリインストールが1800秒後にタイムアウトしました。ライブラリはまだインストールされていません: jar: "dbfs:/tmp/DATABRICKS/sess6250142538173973565/staticCode.jar"]
この状況は、並列ジョブの実行時に発生することがあります。Databricksは、ジョブを処理するためのリソースがない場合、ジョブを最大1,800秒(30分)キューイングします。30分以内にリソースが使用できない場合は、ジョブは失敗します。タイムアウトを回避するには次のアクションを検討してください。
  • Databricksクラスタのプリエンプション環境変数を設定して、各ジョブに割り当てられるリソースの量をコントロールします。プリエンプションの詳細については、『
    Big Data Management Integrationガイド
    』を参照してください。
  • エフェメラルクラスタを作成するクラスタワークフローを実行します。ワークフローは、クラスタを作成しジョブを実行してから、そのクラスタを削除するように設定できます。エフェメラルクラスタの詳細については、クラスタワークフローを参照してください。
InformaticaはDatabricksを統合し、標準並列クラスタをサポートします。標準並列クラスタの最大キュー時間は30分で、タイムアウトに達するとジョブが失敗します。最大キュー時間は延長できません。プリエンプションのしきい値を設定すると、より多くのジョブを並列実行できますが、割り当てられるリソースの割合が小さくなり、ジョブの実行に時間がかかる可能性があります。また、プリエンプションの環境を設定しても、すべてのジョブの実行が保証されるわけではありません。プリエンプションの設定に加えて、クラスタワークフローを実行して、クラスタを作成しジョブを実行してから、そのクラスタを削除するエフェメラルクラスタを作成することができます。Databricksの並列の詳細については、Azure Databricksに問い合わせてください。