Hi, I'm Ask INFA!
What would you like to know?
ASK INFAPreview
Please to access Ask INFA.

目次

Search

  1. はじめに
  2. アプリケーション取り込みとレプリケーション

アプリケーション取り込みとレプリケーション

アプリケーション取り込みとレプリケーション

スケジュールとランタイムオプションの設定

スケジュールとランタイムオプションの設定

アプリケーション取り込みとレプリケーション
タスクウィザードの
[スケジュールおよびランタイムオプション]
ページでは、初期ロードジョブを実行するスケジュールを指定し、すべてのロードタイプのジョブのランタイムオプションを設定できます。
  1. [スキーマドリフトオプション]
    セクションで、各タイプのデータ定義言語(DDL)操作に使用するスキーマドリフトオプションを指定します。
    [スキーマドリフトオプション]
    セクションは、増分ロードタスクおよび初期ロードと増分ロードの組み合わせタスクに対してのみ表示されます。さらに、このセクションは、スキーマ変更の自動検出をサポートするソースに対してのみ表示されます。
    次の表に、DDL操作に指定できるスキーマドリフトオプションを示します。
    オプション
    説明
    無視
    ソーススキーマで発生するDDLの変更をターゲットにレプリケートしません。
    レプリケート
    アプリケーション取り込みとレプリケーション
    ジョブがDDL変更をターゲットにレプリケートできるようにします。
    • プライマリキーフィールドを追加するフィールドの追加操作はサポートされておらず、予期しない結果を引き起こす可能性があります。
    • フィールドのNULLまたはNOT NULL制約を変更するフィールドの変更操作は、ターゲットにレプリケートされません。
    サポートされているDDL操作のタイプは次のとおりです。
    • カラムの追加
    • カラムの変更
    • カラムの削除
    • カラム名の変更
    アプリケーション取り込みとレプリケーション
    ジョブは、Google BigQueryターゲットのカラムの変更または名前変更、およびOracleターゲットのカラムの追加をサポートしていません。
    ジョブの停止
    アプリケーション取り込みとレプリケーション
    ジョブを停止します。
    オブジェクトを停止
    DDL変更が発生したソースオブジェクトの処理を停止します。
    1つ以上のオブジェクトが[オブジェクトを停止]スキーマドリフトオプションによってレプリケーションから除外された場合、ジョブのステータスが
    [実行中(警告あり)]
    に変わります。
    アプリケーション取り込みとレプリケーション
    ジョブは、ジョブが変更の処理を停止した後にソースオブジェクトで発生したデータ変更を取得できません。このアクションにより、ターゲットでデータ損失が発生します。データの損失を回避するには、
    アプリケーション取り込みとレプリケーション
    ジョブを再開する前に、ジョブが処理を停止したソースオブジェクトとターゲットオブジェクトを再同期する必要があります。
  2. 必要に応じ、
    [詳細]
    セクションで
    [出力ファイルの行数]
    の値を変更し、
    アプリケーション取り込みとレプリケーション
    タスクが、Amazon Redishift、Amazon S3、Google Big Query、Google Cloud Storage、Microsoft Azure Data Lake Storage、Microsoft Azure Synapse Analytics、Microsoft Fabric OneLake、Oracle、またはSnowflakeターゲットの出力ファイルに書き込む最大カラム数を指定します。
    有効な値は1〜100000000で、デフォルト値は100000行です。
    増分ロード操作と、初期ロード操作と増分ロード操作の組み合わせの場合、指定した行数に達したとき、またはフラッシュ待ち時間が経過して、トランザクションの処理の途中でジョブが実行されない場合に、変更データがターゲットにフラッシュされます。フラッシュ待ち時間は、ジョブがデータをターゲットにフラッシュする前に、さらに変更データを待機する時間です。待ち時間は10秒に設定されており、変更できません。
  3. 初期ロードジョブの場合のみ、Amazon S3、Google Cloud Storage、Microsoft Azure Data Lake Storage、またはMicrosoft Fabric OneLakeターゲットの出力データファイルに.dat拡張子を付ける場合は、必要に応じて
    [ファイルタイプに基づくファイル拡張子]
    チェックボックスをクリアします。このチェックボックスはデフォルトで選択されており、出力ファイルのファイルタイプに基づいてファイル名拡張子が付けられます。
    これらのターゲットタイプの増分ロードジョブの場合、このオプションは使用できません。
    アプリケーション取り込みとレプリケーション
    は、常にファイルタイプに基づいて出力ファイル名拡張子を使用します。
  4. 必要に応じて、適用サイクルを設定します。適用サイクルとは、変更データを適用するサイクルであり、ソースの中間データを取得する処理から始まって、ターゲットにデータをコミットして終わります。連続レプリケーションの場合、ソースは待ち時間の短い複数の適用サイクルでデータを処理します。
    Amazon S3、Google Cloud Storage、Microsoft Azure Data Lake Storage Gen2、またはMicrosoft Fabric OneLakeターゲットを持つ
    アプリケーション取り込みとレプリケーション
    の増分ロードタスクの場合、次の適用サイクルオプションを設定できます。
    オプション
    説明
    サイクル間隔の適用
    アプリケーション取り込みとレプリケーション
    ジョブが適用サイクルを終了するまでに経過する必要のある時間を指定します。日、時間、分、秒を指定するか、これらの時間フィールドのサブセットに値を指定して、他のフィールドを空白のままにすることができます。
    デフォルト値は15分です。
    サイクル変更制限の適用
    アプリケーション取り込みとレプリケーション
    ジョブが適用サイクルを終了するまでに処理する必要のあるレコード数を指定します。このレコード制限に達すると、取り込みジョブは適用サイクルを終了し、変更データをターゲットに書き込みます。
    デフォルト値は10000レコードです。
    起動中に、古いデータのバックログの処理に追いつく必要がある場合、ジョブは適用サイクル間隔よりも頻繁にこの制限に達する可能性があります。
    低アクティビティのフラッシュ間隔
    アプリケーション取り込みとレプリケーション
    ジョブが適用サイクルを終了する前に、ソースで変更アクティビティがない期間中に経過する必要がある時間を時間、分、またはその両方で指定します。この時間制限に達すると、取り込みジョブは適用サイクルを終了し、変更データをターゲットに書き込みます。
    このオプションの値を指定しない場合、データベース取り込みジョブは、
    [サイクル変更制限の適用]
    または
    [サイクル間隔の適用]
    のいずれかの制限に達した後にのみ適用サイクルを終了します。
    デフォルト値は指定されていません。
    • [サイクル間隔の適用]
      または
      [サイクル変更制限の適用]
      フィールドのいずれかが、ゼロ以外の値であるか、デフォルト値を使用する必要があります。
    • 適用サイクルは、ジョブが3つの制限のいずれかで、最初に満たされた制限に達すると終了します。
  5. Apache Kafkaターゲットを持つ増分ロードジョブの場合、次のチェックポイントオプションを設定します。
    オプション
    説明
    チェックポイントのすべての行
    データベース取り込みジョブが、Kafkaターゲットに送信されるすべてのメッセージに対してチェックポイント処理を実行するかどうかを示します。
    このチェックボックスが選択されている場合、
    [チェックポイントすべてのコミット]
    [チェックポイントの行数]
    、および
    [チェックポイントの頻度(秒)]
    オプションは無視されます。
    チェックポイントのすべてのコミット
    アプリケーション取り込みとレプリケーション
    ジョブが、ソースで発生するすべてのコミットに対してチェックポイント処理を実行するかどうかを示します。
    チェックポイントの行数
    チェックポイントを追加する前に、
    アプリケーション取り込みとレプリケーション
    ジョブがターゲットに送信するメッセージの最大数を指定します。このオプションを0に設定すると、データベース取り込みジョブはメッセージの数に基づいてチェックポイント処理を実行しません。このオプションを1に設定すると、データベース取り込みジョブは各メッセージにチェックポイントを追加します。
    チェックポイントの頻度(秒)
    アプリケーション取り込みとレプリケーション
    ジョブがチェックポイントを追加するまでに経過する必要がある最大秒数を指定します。このオプションを0に設定すると、データベース取り込みジョブは経過時間に基づいてチェックポイント処理を実行しません。
  6. タスクに関連付けられた
    アプリケーション取り込みとレプリケーション
    ジョブをスケジュールに基づいて特定の間隔で実行する場合は、
    [スケジュール]
    セクションで
    [このタスクは指定したスケジュールを使用する]
    を選択して、ジョブの事前定義されたスケジュールを選択します。
    デフォルトでは、
    [このタスクはスケジュールを使用しない]
    が選択されており、手動でトリガされた場合にのみジョブを実行するように設定されます。
    このフィールドは、初期ロードタスクでのみ使用できます。
    Administratorでジョブスケジュールオプションを表示および編集できます。スケジュールを編集すると、変更は、スケジュールに基づいて実行するように設定されているすべてのジョブに自動的に適用されます。すでにデプロイされているタスクのスケジュールを変更すると、更新されたスケジュールは、タスクに関連付けられた
    アプリケーション取り込みとレプリケーション
    ジョブに自動的に適用されます。
    前の実行がまだ進行中のときに、ジョブがスケジュールに基づいてトリガされる段階になっても、
    アプリケーション取り込みとレプリケーション
    はジョブを実行せず、すでに進行中のジョブ実行を完了させます。
  7. [タスクフロー]
    で、
    アプリケーション取り込みとレプリケーション
    タスクを作成する場合、タスクがデプロイされ、データ統合でタスクフローに追加できるようになったら、
    [タスクフローで実行]
    を選択します。その後、タスクフローにタスクをイベントソースとして含めて、トランスフォーメーションを追加して取り込んだデータを変換できます。
    [Superpipe]
    オプションを使用しないSnowflakeターゲットを持つ初期ロードタスクおよび増分ロードタスクで使用できます
  8. [カスタムプロパティ]
    セクションで、特別なケースに対応するためにInformaticaが提供するカスタムプロパティを指定できます。プロパティを追加するには、
    [プロパティの追加]
    アイコンをクリックしてから、プロパティの名前と値を追加します。
    カスタムプロパティは、固有の環境と特別な使用例に対応するように設定されています。
    カスタムプロパティを指定する場合は、Informaticaグローバルカスタマサポートにお問い合わせください。