Mass Ingestion
- Mass Ingestion
- 所有产品
オプション
| 説明
|
---|---|
サイクル間隔の適用
| データベース取り込みジョブが適用サイクルを終了するまでに経過する必要のある時間を指定します。日、時間、分、秒を指定するか、これらの時間フィールドのサブセットに値を指定して、他のフィールドを空白のままにすることができます。
デフォルト値は15分です。
|
サイクル変更制限の適用
| ジョブが適用サイクルを終了する前に処理する必要がある、データベース取り込みジョブのすべてのテーブル内のレコードの合計数を指定します。このレコード制限に達すると、データベース取り込みジョブは適用サイクルを終了し、変更データをターゲットに書き込みます。
デフォルト値は10000レコードです。
起動中に、古いデータのバックログの処理に追いつく必要がある場合、ジョブは適用サイクル間隔よりも頻繁にこの制限に達する可能性があります。
|
低アクティビティのフラッシュ間隔
| データベース取り込みジョブが適用サイクルを終了する前に、ソースで変更アクティビティがない期間中に経過する必要がある時間を時間、分、またはその両方で指定します。この時間制限に達すると、データベース取り込みジョブは適用サイクルを終了し、変更データをターゲットに書き込みます。
このオプションの値を指定しない場合、データベース取り込みジョブは、 [サイクル変更制限の適用] または[サイクル間隔の適用] のいずれかの制限に達した後にのみ適用サイクルを終了します。
デフォルト値は指定されていません。
|
ソース
| ロードタイプ
| ターゲット
|
---|---|---|
Db2 for i
| 差分
初期と増分の組み合わせ
| Amazon Redshift、Amazon S3、Databricks Delta、Google BigQuery、Google Cloud Storage、Kafka(増分ロードのみ)、Microsoft Azure Data Lake Storage、Microsoft Azure Synapse Analytics、Oracle、Oracle Cloud Object Storage、またはSnowflake
|
DB2 for LUW
| 差分
初期ロードと増分ロードの組み合わせ
| Snowflake
|
DB2 for z/OS(Db2 11を除く)
| 差分
初期と増分の組み合わせ
| Amazon Redshift、Amazon S3、Databricks Delta、Google BigQuery、Google Cloud Storage、Kafka(増分ロードのみ)、Microsoft Azure Data Lake Storage、Microsoft Azure Synapse Analytics、Oracle、Oracle Cloud Object Storage、またはSnowflake
|
Microsoft SQL Server
| 差分
初期と増分の組み合わせ
| Amazon Redshift、Amazon S3、Databricks Delta、Google BigQuery、Google Cloud Storage、Kafka(増分ロードのみ)、Microsoft Azure Data Lake Storage、Microsoft Azure Synapse Analytics、Oracle、Oracle Cloud Object Storage、またはSnowflake
|
Oracle
| 差分
初期と増分の組み合わせ
| Amazon Redshift、Amazon S3、Databricks Delta、Google BigQuery、Google Cloud Storage、Kafka(増分ロードのみ)、Microsoft Azure Data Lake Storage、Microsoft Azure Synapse Analytics、Oracle、Oracle Cloud Object Storage、またはSnowflake
|
PostgreSQL
| 差分
初期と増分の組み合わせ
| 増分ロード: Amazon Redshift、Amazon S3、Databricks Delta、Google BigQuery、Google Cloud Storage、Kafka(増分ロードのみ)、Microsoft Azure Data Lake Storage、Microsoft Azure Synapse Analytics、Oracle、Oracle Cloud Object Storage、またはSnowflake
初期と増分の組み合わせ: OracleまたはSnowflake
|
オプション
| 説明
|
---|---|
無視
| ソースデータベースで発生するDDLの変更をターゲットにレプリケートしません。Amazon Redshift、Kafka、Microsoft Azure Synapse Analytics、またはSnowflakeターゲットの場合、このオプションは、[カラムの削除]および[カラム名の変更]操作タイプのデフォルトオプションです。
CSV出力形式を使用するAmazon S3、Google Cloud Storage、Microsoft Azure Data Lake Storage、およびOracle Cloud Object Storageターゲットの場合、 [無視] オプションは無効です。AVRO出力形式の場合、このオプションは有効になっています。
|
レプリケート
| DDL操作をターゲットにレプリケートします。Amazon S3、Google Cloud Storage、Microsoft Azure Data Lake Storage、およびOracle Cloud Object Storageターゲットの場合、このオプションはすべての操作タイプのデフォルトオプションです。他のターゲットの場合、このオプションは、[カラムの追加]および[カラムの変更]操作タイプのデフォルトオプションです。
|
ジョブの停止
| データベース取り込みジョブ全体を停止します。
|
テーブルの停止
| DDL変更が発生したソーステーブルの処理を停止します。1つ以上のテーブルが [テーブルの停止] スキーマドリフトオプションによってレプリケーションから除外された場合、ジョブの状態が[実行中(警告あり)] に変わります。
データベース取り込みジョブは、ジョブがソーステーブルの処理を停止した後にソーステーブルで発生したデータ変更を取得できません。その結果、ターゲットでデータ損失が発生する可能性があります。データの損失を回避するには、ジョブが処理を停止したソースオブジェクトとターゲットオブジェクトを再同期する必要があります。データベース取り込みジョブの再開時のスキーマドリフトオプションのオーバーライドを参照してください。
オプションを使用します。詳細については、 |
オプション
| 説明
|
---|---|
チェックポイントのすべての行
| データベース取り込みジョブが、Kafkaターゲットに送信されるすべてのメッセージに対してチェックポイント処理を実行するかどうかを示します。
このチェックボックスが選択されている場合、 [チェックポイントすべてのコミット] 、[チェックポイントの行数] 、および[チェックポイントの頻度(秒)] オプションは無視されます。
|
チェックポイントのすべてのコミット
| データベース取り込みジョブが、ソースで発生するすべてのコミットに対してチェックポイント処理を実行するかどうかを示します。
|
チェックポイントの行数
| チェックポイントを追加する前に、データベース取り込みジョブがターゲットに送信するメッセージの最大数を指定します。このオプションを0に設定すると、データベース取り込みジョブはメッセージの数に基づいてチェックポイント処理を実行しません。このオプションを1に設定すると、データベース取り込みジョブは各メッセージにチェックポイントを追加します。
|
チェックポイントの頻度(秒)
| データベース取り込みジョブがチェックポイントを追加するまでに経過する必要がある最大秒数を指定します。このオプションを0に設定すると、データベース取り込みジョブは経過時間に基づいてチェックポイント処理を実行しません。
|