目次

Search

  1. はじめに
  2. 一括取り込みデータベース

一括取り込みデータベース

一括取り込みデータベース

ソースの設定

ソースの設定

データベース統合
タスクウィザードの
[ソース]
ページでソースを設定します。
MongoDBソースの場合のみ、タスクウィザードはスキーマ
の代わりにデータベース
を表示し、テーブル
の代わりにコレクション
を表示します。ただし、このドキュメントでは、単純化するため、すべてのソースタイプを網羅するようにスキーマ
とテーブル
という用語を使用しています。
  1. [接続]
    リストで、ソースシステムの接続を選択します。接続タイプは、接続名の後の括弧内に表示されます。
    組織が使用するランタイム環境の接続は、
    管理者
    で事前定義する必要があります。
    リストには、
    [定義]
    ページで選択されたロードタイプに有効な接続タイプのみが含まれます。ロードタイプを選択しなかった場合、接続は一覧表示されません。
    ロードタイプを変更し、選択した接続が無効になると、警告メッセージが発行され、
    [接続]
    フィールドがクリアされます。更新されたロードタイプに有効な別の接続を選択する必要があります。
    取り込みタスクをデプロイした後は、最初に関連する取り込みジョブをデプロイ解除せずに接続を変更することはできません。接続を変更した後、タスクを再度デプロイする必要があります。
  2. [スキーマ]
    リストで、ソーステーブルを含むソーススキーマを選択します。
    リストには、指定されたソース接続でアクセスされるデータベースで使用可能なスキーマのみが含まれます。
    Oracle、Microsoft SQL Server、Netezza、またはPostgreSQLソースを持つタスクを作成する場合、接続プロパティで指定されたスキーマ名がデフォルトで表示されます。
  3. 増分ロードタスク用にDB2 for iソースを定義する場合は、
    [ジャーナル名]
    フィールドで、ソーステーブルに加えられた変更を記録するジャーナルの名前を選択します。
  4. 増分ロードタスク、または初期ロードと増分ロードの組み合わせタスクのPostgreSQLソースを定義する場合は、次のフィールドに入力します。
    フィールド
    説明
    レプリケーションスロット名
    PostgreSQLレプリケーションスロットの一意の名前。
    スロット名には、小文字のラテン英数字とアンダースコア(_)文字を含めることができます。
    最大長は63文字です。
    各データベース取り込みタスクは、異なるレプリケーションスロットを使用する必要があります。
    レプリケーションプラグイン
    PostgreSQLレプリケーションプラグイン。次のオプションがあります。
    • pgoutput
      。このオプションは、PostgreSQLバージョン10以降でのみ選択できます。
    • wal2json
    パブリケーション
    レプリケーションプラグインとして
    pgoutput
    を選択した場合は、このプラグインが使用するパブリケーション名を指定します。
    レプリケーションプラグインとしてwal2jsonを選択した場合、このフィールドは表示されません。
  5. Db2 for LUW、Oracle、またはSQL Serverソースを持つ増分ロードタスク、または初期ロードと増分ロードの組み合わせタスクを定義する場合は、
    [変更データキャプチャメソッド]
    で使用するキャプチャメソッドを選択します。
    1. [CDCメソッド]
      フィールドで、次のオプションのいずれかを選択して、ソースの変更をキャプチャするために使用するメソッドを指定します。
      方法
      サポートされるソース
      説明
      CDCテーブル
      SQL Serverのみ
      SQL Server CDCテーブルからデータ変更を直接読み取ります。
      ログベース
      OracleおよびSQL Server
      データベーストランザクションログを読み取ることによって、挿入、更新、削除、およびカラムのDDL変更を近似リアルタイムでキャプチャします。
      Oracleソースの場合、データ変更はOracle REDOログから読み取られます。
      SQL Serverソースの場合、データ変更はSQL Serverトランザクションログと有効なSQL Server CDCテーブルから読み取られます。
      クエリベース
      Db2 for LUW、Oracle、およびSQL Server
      CDCクエリカラムを指すSQL WHERE句を使用して、挿入と更新をキャプチャします。クエリカラムは、CDC間隔の開始以降にソーステーブルに加えられた変更を含む行の識別に使用されます。
      増分ロードジョブおよび初期ロードと増分ロードの組み合わせジョブのDb2 for LUWソースの場合、このキャプチャメソッドのみ使用できます。
    2. [クエリベース]
      オプションを選択した場合は、次の追加フィールドに入力します。
      • CDCクエリカラムタイプ
        。ソーステーブルにおけるCDCクエリカラムのカラムタイプです。利用可能な唯一のオプションは
        [タイムスタンプ]
        です。
        「タイムスタンプ」は、日付と時刻を組み合わせたカラムデータ型を表します。Oracleの場合、クエリカラムでサポートされるデータ型はTIMESTAMPです。SQL Serverの場合、クエリカラムでサポートされるデータ型はDATETIMEとDATETIME2です。
      • CDCクエリカラム名
        。ソーステーブルにおけるCDCクエリカラムの、大文字小文字が区別された名前です。カラムはソーステーブルに存在する必要があります。最大長は70文字です。
      • CDC間隔
        。日数、時間数、分数で表される、クエリベースの変更データキャプチャサイクルの頻度です。少なくとも1つの間隔フィールドに正の数値を入力する必要があります。入力しない場合、タスクを保存しようとすると、エラーが発生します。デフォルト値は5分です。
  6. [テーブルの選択]
    で、以下のいずれかの方法を使用してソーステーブルを選択します。
    • データレプリケーション用のスキーマ内のすべてのテーブルとカラムを選択するには、
      [すべて選択]
      を選択します。
      [選択されたテーブル]
      フィールドには、選択されたすべてのテーブルの数が表示されます。
      [テーブルビュー]
      での選択内容を後で編集することはできません。
      すべてのテーブルの情報を取得するには、時間がかかる場合があります。
    • [ルール]
      で、レプリケートするソーステーブルのサブセットを指定するルールを定義します。ルールを使用すると、
      [テーブルビュー]
      でテーブルや、選択したテーブルのカラムを個別に選択または選択解除できます。また、文字データのスペースを切り捨てるオプションを設定することもできます。ルールを追加するには、Step 8に進みます。
  7. データベースビューをソースとして含める場合は、[更新]アイコンの右側にある
    [ビューを含める]
    チェックボックスを選択します。このチェックボックスは、Db2 for i、Db2 for LUW、Microsoft SQL Server、MySQL、Oracle、PostgreSQL、またはTeradataソースを持つ初期ロードタスクでのみ使用できます。
    ビューが取得され、
    [選択されたテーブル]
    のカウント、およびテーブル名のリストに含まれます。
  8. テーブル選択ルールを追加するには、まず
    [すべて選択]
    チェックボックスがオフになっていることを確認します。次に、以下のサブステップを実行します。
    1. [ルール]
      で、最初のテーブルの上にある[ルールの追加](+)アイコンをクリックします。テーブルに行が追加されます。
    2. [テーブルルール]
      カラムで
      [含める]
      または
      [除外する]
      を選択して、包含ルールまたは除外ルールを作成します。
    3. [条件]
      カラムに、テーブル名、または1つ以上のワイルドカードを含むテーブル名マスクを入力して、テーブル選択に含める、またはテーブル選択から除外するソーステーブルを特定します。次のガイドラインを使用します。
      • マスクには、次のワイルドカードの1つまたは両方を含めることができます: 1つ以上の文字を表すアスタリスク(*)ワイルドカードと単一の文字を表す疑問符(?)ワイルドカード。ワイルドカードは、マスク値内で複数回使用することができ、値内のどこでも使用できます。
      • タスクウィザードでは大文字と小文字が区別されます。テーブルが定義された際の指定どおりに大文字小文字を区別してテーブル名またはマスクを入力します。
      • ソースデータベースで使用されている場合でも、引用符や括弧などの区切り文字は含めないでください。例えば、Oracleでは、名前を小文字または大文字と小文字の混在で格納されるように、小文字の名前または大文字と小文字が混在する名前を引用符で囲む必要があります。ただし、タスクウィザードでは、小文字または大文字と小文字が混在する名前を引用符なしで入力する必要があります。
      • テーブル名にバックスラッシュ(\)、アスタリスク(*)、ドル記号($)、キャレット(^)、疑問符(?)などの特殊文字が含まれている場合は、ルールを入力するときに名前の各特殊文字をバックスラッシュ(\)でエスケープします。
    4. 必要に応じて追加のルールを定義します。
      含めるルールと除外ルールを複数定義すると、一覧表示されている順序で上から下に処理されます。矢印アイコンを使用して順序を変更します。複数のルールを使用する例については、「ソーステーブルを選択するルールの例」を参照してください。
    5. 終了したら、
      [ルールの適用]
      をクリックします。
      [選択されたテーブルの総数]
      [テーブルビュー]
      の数が更新されます。[更新]アイコンをクリックすると、各ルールの
      [影響を受けるテーブル]
      の数が表示されます。
      次の図は、
      [ソース]
      ページで定義した複数のルールを示しています。
      ルールの適用後にルールを追加、削除、または変更する場合は、
      [ルールの適用]
      を再度クリックする必要があります。[更新]アイコンをクリックして、テーブル数を更新します。
      [ルールの適用]
      をクリックせずにすべてのルールを削除した場合、デプロイ時に検証エラーが発生します。
      [テーブルビュー]
      リストには引き続きテーブルが表示されます。
      [すべて選択]
      に切り替えると、ルールは無効になり、表示されなくなります。
  9. ルールに基づいて選択されたソーステーブルの文字カラムに対して切り捨てアクションを実行するには、
    [ルール]
    にある2番目の[アクション]テーブルでカラムアクションルールを作成します。
    MongoDBソースに対してカラムアクションルールを作成することはできません。
    1. 2番目のテーブルの上にある[ルールの追加](+)アイコンをクリックします。
    2. [アクション]
      カラムで、次のいずれかのオプションを選択します。
      • LTRIM
        .文字カラム値の左側のスペースを切り捨てます。
      • RTRIM
        .文字カラム値の右側のスペースを切り捨てます。
      • TRIM
        .文字カラム値の左側と右側のスペースを切り捨てます。
    3. [条件]
      カラムに、カラム名または1つ以上のアスタリスク(*)または疑問符(?)を含むカラム名マスクを入力します。ワイルドカード。値は、アクションが適用されるカラムを識別するために、選択したソーステーブルのカラムと照合されます。
    異なるアクションタイプに対して、あるいは条件が異なる同じアクションタイプに対して複数のルールを定義できます。ルールは、リストされている順序で上から下に処理されます。矢印アイコンを使用して順序を変更します。
  10. [テーブルビュー]
    で、選択したソーステーブルとカラムのセットを表示または編集します。
    [すべて選択]
    を選択した場合、テーブルとカラムのリストは表示専用です。
    ルールを適用した場合は、個々のテーブルの横にあるチェックボックスをクリックして、選択したテーブルのセットを絞り込むことができます。レプリケートしないテーブルの選択を解除するか、レプリケートする追加の項目を選択します。[更新]アイコンをクリックして、選択したテーブルの数を更新します。
    OracleおよびSQL Serverソースの場合のみ、選択したソーステーブルのカラムを個別に選択解除または再選択することもできます。選択したテーブルのデータのレプリケート元のカラムを表示または変更するには、
    [カラム]
    カラムにある、強調表示されたカラム数をクリックします。カラム名とデータ型が右側に表示されます。デフォルトでは、選択したソーステーブルのすべてカラムが選択されています。カラムを選択解除または再選択するには、カラム名の横にあるチェックボックスをクリックします。プライマリキーカラムを選択解除することはできません。
    次の図は、選択したテーブルと、最初のテーブルで選択したカラムを示しています。
    注:
    • テーブルやカラムを検索するには、[カラム]リストの上のドロップダウンリストで
      [テーブル名]
      [カラム]
      、または
      [すべて]
      を選択し、[検索]
      ボックスに検索文字列を入力して
      [検索]
      をクリックします。文字列の先頭または末尾にアスタリスク(*)ワイルドカードを1つ含めることができます。
    • テーブルまたはカラムのチェックボックス設定を初めて変更すると、ルールは無効になります。
      [テーブルビュー]
      の選択内容が優先されます。ただし、[ルールの追加](+)アイコンを再度クリックすると、個別に選択解除または選択したテーブルが、新しいルールとして[ルール]リストに反映され、ルールが再び優先されます。
      [テーブルビュー]
      リストに戻るには、
      [ルールの適用]
      を再度クリックします。
    • [テーブルビュー]
      セクションには、文字カラムの長さがバイト単位で示されます。文字あたりのバイト数はデータベースで使用される文字セットエンコーディングによって異なるため、一部のソースでは、実際のカラムの長さの文字数が
      [テーブルビュー]
      に表示されるバイト数と異なる場合があります。
    • カラムを個別に選択した場合、結果として得られるカラムのセットはスキーマドリフトの設定に関係なく固定で、スキーマの変更によって更新されることはありません。たとえば、ソースカラムが追加または名前変更された場合、そのカラムは選択されたカラムのリストに含まれていないため、CDC処理からサイレントに除外されます。ただし、選択したカラムがソースで削除された場合、スキーマドリフトの[カラムの削除]オプションによって処理方法が制御されます。削除されたカラムの操作は、ルールを再度適用するまでカラムのリストに反映されません。
    • 初期ロードと増分ロードの組み合わせジョブの場合、カラム選択を追加または変更すると、再同期操作が自動的にトリガされます。再同期は、ターゲットテーブルがソースと同じ値を持つようにするために必要です。再同期オプションがない増分ロードジョブの場合、カラム選択を変更するとエラーになります。デプロイしたジョブのカラム選択を変更してから再デプロイすると、ソースとターゲットは一致しなくなります。
      注: 選択したカラムを削除しても、再同期操作はトリガされず、エラーは報告されません。選択したカラムの削除は、カラム削除イベントと同じように扱われ、タスクのカラム削除スキーマのドリフト設定がトリガされます。
  11. DB2 for i、DB2 for z/OS、Microsoft SQL Server、Oracle、PostgreSQL、SAP HANA、またはSAP HANA Cloudソースを持つ増分ロードタスク、または初期ロードタスクと増分ロードタスクの組み合わせを定義しようとしていて、選択したソーステーブルの1つ以上で変更データキャプチャが有効になっていない場合は、CDCを有効にするためのスクリプトを生成してから、スクリプトを実行またはダウンロードできます。
    Db2 for LUW、Oracle、またはSQL ServerソースのCDCメソッドとして
    [クエリベース]
    を選択した場合、
    [CDCスクリプト]
    フィールドはクエリベースの変更キャプチャメソッドには適用できないため、使用できません。
    1. [CDCスクリプト]
      フィールドで、次のオプションのいずれかを選択します。
      • すべてのカラムのCDCを有効化
        。選択されたソーステーブルのすべてのカラムに対してCDCを有効にします。このオプションは、DB2 for i、DB2 for z/OS、PostgreSQL、SAP HANA、SAP HANA Cloud、またはSQL Serverソースの唯一の有効なオプションです。
        一意のインデックスを持つテーブルを含め、プライマリキーのないソーステーブルの場合、選択されているオプションに関係なく、デフォルトですべてのカラムのCDCが有効になっています。
      • プライマリキーカラムのCDCを有効化
        。選択されたソーステーブルのプライマリキーカラムに対してのみCDCを有効にします。このオプションは、DB2 for i、DB2 for z/OS、PostgreSQL、SQL Serverソース、またはGoogle BigQueryターゲットを持つタスクには使用しないでください。
      スクリプトは、ソースタイプに応じて、次の方法でCDCを有効にします。
      • DB2 for iソースの場合、スクリプトはソーステーブルでのジャーナルを有効にします。
      • Db2 for z/OSソースの場合、スクリプトはソーステーブルとCDCに必要な特定のDb2カタログテーブルに対してDATA CAPTURE CHANGESを設定します。1つのジョブにDATA CAPTURE CHANGESが設定されると、他のすべてのジョブは、Db2で必要なカタログテーブルに対してその属性が有効になったことを認識します。これは、Db2カタログテーブルがDb2のすべてのユーザーによって共有されるテーブルのセットであるためです。
      • Microsoft SQL Serverソースの場合、スクリプトはストアドプロシージャsys.sp_cdc_enable_dbおよびsys.sp_cdc_enable_tableを実行して、ソースデータベースおよびテーブルでCDCを有効にします。RDS for SQL Serverの場合、スクリプトは
        msdb.dbo.rds_cdc_enable_db
        プロシージャを実行してソースデータベースでCDCを有効にし、
        sys.sp_cdc_enable_table
        スクリプトを実行してテーブルのCDCを追跡します。
      • Oracleソースの場合、スクリプトは、選択したソーステーブルのすべてまたはプライマリキーカラムの補足ログを有効にして、REDOログに追加情報を記録します。
      • PostgreSQLソースの場合、スクリプトは選択されたソーステーブルにREPLICATION IDENTITY FULLを設定して、すべてのカラム値をWALファイルに書き込みます。このスクリプトは、pgoutputまたはwal2jsonタイプのレプリケーションスロットも作成します。スロットタイプがpgoutputの場合、スクリプトはパブリケーションも作成し、そこにテーブルを追加します。
      • SAP HANAおよびSAP HANA Cloudソースの場合、スクリプトは必要なPKLOG、PROCESSED、および_CDCシャドーテーブルを作成します。このスクリプトは、選択されたソーステーブルごとに3つのトリガと1つのシーケンスも作成します。
    2. スクリプトを実行するには、
      [実行]
      をクリックします。
      スクリプトを実行できるデータベースロールまたは特権がない場合は、[ダウンロード]アイコンをクリックしてスクリプトをダウンロードします。スクリプトファイル名の形式は次のとおりです。
      cdc_script_
      taskname
      _
      number
      .txt
      次に、データベース管理者にスクリプトの実行を依頼します。
      データベース取り込みタスクを実行する前に、スクリプトが実行されていることを確認してください。
    後で
    [CDCスクリプト]
    オプションに変更して、スクリプトを再度実行すると、スクリプトは最初に元のカラムセットに対するCDCを削除し、次に現在のカラムセットに対してCDCを有効にします。SAP HANAソースの場合、PROCESSEDテーブルとPKLOGテーブルがすでに存在するときは、それらは新しいスクリプトから省略されます。シャドー_CDCテーブルとトリガが、選択されたいずれかのテーブルにすでに存在する場合、それらのオブジェクトを作成するSQL文は、新しいスクリプトではコメントアウトされます。
  12. Microsoft SQL Serverソースの場合は、次のフィールドに入力します。
    • [キャプチャファイルグループ]
      フィールドに、キャプチャ用に作成される変更テーブルに使用するファイルグループの名前を入力します。このフィールドを空のままにすると、変更テーブルはデータベースのデフォルトのファイルグループに配置されます。
    • [ゲートロール]
      フィールドに、データを変更するためのアクセスをゲートするために使用されるデータベースロールの名前を入力します。このフィールドを空のままにすると、データベースはゲートロールを使用しません。
  13. テーブル選択条件に一致するソーステーブルのリストを作成してダウンロードするには、次のサブ手順を実行します。
    1. ルールベースのテーブル選択を使用した場合は、
      [ルールタイプ別のテーブルのリスト]
      で、使用する選択ルールのタイプを選択します。次のオプションがあります。
      • 含めるルールのみ
      • 除外ルールのみ
      • 含めるルールと除外ルール
    2. 使用したテーブル選択方法に関係なく、リストにカラムを含めるには、
      [カラムを含める]
      チェックボックスを選択します。
      このオプションはMongoDBソースでは使用できません。
    3. [ダウンロード]アイコンをクリックします。
      カラムを含むダウンロードしたリストの形式は次のとおりです。
      status
      ,
      schema_name
      ,
      table_name
      ,
      object_type
      ,
      column_name
      ,
      comment
      次の表に、ダウンロードしたリストに表示される情報を示します。
      フィールド
      説明
      status
      一括取り込みデータベースにサポートされていないタイプがあるために、ソーステーブルまたはカラムを処理から除外するかどうかを示します。有効な値は以下のとおりです。
      • E
        。オブジェクトは、除外ルールによって処理から除外されます。
      • I
        : オブジェクトは処理に含まれます。
      • X
        。このオブジェクトはサポートされていないタイプのオブジェクトであるため、処理から除外されます。例えば、サポートされていないタイプのオブジェクトには、サポートされていないデータ型のカラムと、サポートされていないカラムのみを含むテーブルが含まれます。コメントフィールドに、サポートされていないタイプの詳細が示されます。
      schema_name
      ソーススキーマの名前を指定します。
      table_name
      ソーステーブルの名前を指定します。
      object_type
      ソースオブジェクトのタイプを指定します。有効な値は以下のとおりです。
      • C
        。カラム。
      • T
        。テーブル。
      column_name
      ソースカラムの名前を指定します。この情報は、
      [カラム]
      チェックボックスを選択した場合にのみ表示されます。
      comment
      サポートされていないタイプのソースオブジェクトが、選択ルールに一致していても処理から除外される理由を指定します。
  14. [詳細]
    で、ソースタイプとロードタイプに応じて使用できる詳細プロパティを設定します。
    プロパティ
    ソースとロードタイプ
    説明
    フラッシュバックの無効化
    Oracleソース - 初期ロード
    データベースからデータを取得するときに一括取り込みデータベースがOracle Flashbackを使用できないようにするには、このチェックボックスを選択します。
    Oracle Flashbackを使用するには、ユーザーにEXECUTE ON DBMS_FLASHBACK権限を付与する必要があります。これは、初期ロードには必要ありません。
    このチェックボックスは、新しい初期ロードタスクに対してデフォルトで選択されています。既存の初期ロードタスクの場合、このチェックボックスはデフォルトでクリアされているため、Oracle Flashbackは有効のままになります。パーティション化が有効なタスクの場合、このチェックボックスは自動的に選択され、編集できません。
    LOBを含める
    Oracleソース:
    • Amazon Redshift、Amazon S3、Databricks Delta、Google BigQuery、Google Cloud Storage、Microsoft Azure Data Lake Storage Gen 2、Microsoft Azure Synapse Analytics、Oracle、Oracle Cloud Object Storage、Snowflake、またはSQL Serverターゲットへの初期ロード。PostgreSQLターゲットではサポートされていません。
    PostgreSQLソース:
    • Amazon Redshift、Amazon S3、Databricks Delta、Google BigQuery、Google Cloud Storage、Microsoft Azure Data Lake Storage Gen2、Microsoft Azure Synapse Analytics、Oracle、Oracle Cloud Object Storage、またはSnowflakeターゲットへの初期ロードと増分ロード。
    • Azure Event Hubsへの増分ロード。
    • Snowflakeターゲットへの初期ロードと増分ロードの組み合わせ。
    SQL Serverソース:
    • Amazon Redshift、Amazon S3、Databricks Delta、Google BigQuery、Google Cloud Storage、Microsoft Azure Data Lake Storage Gen 2、Microsoft Azure Synapse Analytics、Oracle、Oracle Cloud Object Storage、Snowflake、またはSQL Serverターゲットへの初期ロード。
    • Azure Event Hubs、Databricks Delta、Snowflake、SQL Serverターゲットへの増分ロード。
    • Databricks Delta、Snowflake、およびSQL Serverターゲットへの初期ロードと増分ロードの組み合わせ。
    CDCメソッドとして
    [クエリベース]
    を選択した場合、このフィールドは無効になります。
    ターゲットにデータをレプリケートするラージオブジェクト(LOB)カラムがソースに含まれている場合は、このチェックボックスを選択します。
    LOBデータ型は次のとおりです。
    • Oracleの場合: BLOB、CLOB、およびNCLOB
    • PostgreSQLの場合: BYTEA、TEXT、およびXML加えて、JSON、JSONBなど大きくなる可能性があるその他の型
    • SQL Serverの場合: GEOGRAPHY、GEOMETRY、IMAGE、NTEXT、NVARCHAR(MAX)、TEXT、VARBINARY(MAX)、VARCHAR(MAX)、およびXML
    ターゲットタイプに固有の切り詰めポイントによっては、LOBデータが切り詰められる場合があります。
    初期ロードの場合:
    • BLOB、BYTEA、GEOGRAPHY、GEOMETRY、IMAGE、またはVARBINARY(MAX)カラムは、ターゲットのBINARYカラムに書き込まれる前に切り詰められます。
      • Amazon S3、Databricks Delta、Google Cloud Storage、Microsoft Azure Data Lake Storage Gen2、Oracle、Oracle Cloud Object Storage、およびSQL Serverターゲットの場合、データは16777216バイトに切り詰められます。
      • Amazon Redshiftターゲットの場合、データは1024000バイトに切り詰められます。
      • Microsoft Azure Synapse Analyticsターゲットの場合、データは1000000バイトに切り詰められます。
      • Google BigQueryおよびSnowflakeターゲットの場合、データは8388608バイトに切り詰められます。
    • CLOB、NCLOB、TEXT、NTEXT、NVARCHAR(MAX)、VARCHAR(MAX)、またはXMLカラムは、ターゲットのVARCHARカラムに書き込まれる前に切り詰められます。
      • Amazon S3、Databricks Delta、Google Cloud Storage、Microsoft Azure Data Lake Storage Gen2、Oracle、Oracle Cloud Object Storage、およびSnowflakeターゲットの場合、データは16777216バイトに切り詰められます。
      • Amazon Redshiftターゲットの場合、データは65535バイトに切り詰められます。
      • Google BigQueryターゲットの場合、データは8388608バイトに切り詰められます。
      • Microsoft Azure Synapse Analyticsターゲットの場合、データは500000バイトに切り詰められます。
      • SQL Serverターゲットの場合、CLOB、TEXT、およびVARCHAR(MAX)データは16777216バイトに、NCLOB、NTEXT、およびNVARCHAR(MAX)データは33554432バイトに、XMLデータは33554442バイトに切り詰められます。
    増分ロードと複合ロードのPostgreSQLソースの場合、ラージオブジェクトカラムに1 MBを超えるデータが含まれていると、データは1 MBに切り詰められます。
    Azure Event Hubsターゲットの場合、全体のレコードの最大サイズは1 MBです。レコードサイズが1 MBを超えると、Azure Event Hubsはエラーを生成し、タスクは失敗します。
    永続ストレージの有効化
    Db2 for LUW(クエリベースのCDC)、MongoDB、Oracle(クエリベースのCDC)、PostgreSQL、SAP HANA、SAP HANA Cloud、およびSQL Server(クエリベースのCDC)を除くすべてのソース - 増分ロード、および初期ロードと増分ロードの組み合わせ。
    クエリベースのCDCメソッドを使用するDb2 for LUW、Oracle、およびSQL Serverソースの場合、このフィールドは表示されません。これは、永続ストレージがデフォルトで有効になっていて変更できないためです。
    MongoDB、PostgreSQL、SAP HANA、およびSAP HANA Cloud変更データソースの場合、永続ストレージがデフォルトで有効になっていて変更できないため、このフィールドは表示されません。
    ターゲットへのデータの書き込みが遅い場合や遅延している場合でもデータを継続的に使用できるようにディスクバッファへのトランザクションデータの永続ストレージを有効にするには、このチェックボックスを選択します。
    永続ストレージを使用する利点は、ソーストランザクションログの消費が高速になり、ログアーカイブやバックアップへの依存度が低くなるため、データベース取り込みジョブを再開した後もディスクストレージ内の永続データに引き続きアクセスできることです。
    パーティション化の有効化
    Oracleソース - 初期ロード、および初期ロードと増分ロードの組み合わせ
    SQL Serverソース - 初期ロード、および初期ロードと増分ロードの組み合わせ
    ソースオブジェクトのパーティション化を有効にする場合は、このチェックボックスを選択します。オブジェクトがパーティション化されると、
    データベース統合
    ジョブは、各パーティションから読み取ったレコードを並列処理します。
    Oracleソースの場合、
    一括取り込みデータベース
    はROWIDをパーティションキーとして使用して、パーティションの範囲を決定します。また、
    [パーティション化の有効化]
    チェックボックスを選択すると、
    [フラッシュバックの無効化]
    チェックボックスが自動的に選択されます。
    SQL Serverソースの場合、パーティション化はプライマリキーに基づきます。
    初期ロードと増分ロードを組み合わせた場合、ソースオブジェクトのパーティション化は初期ロードフェーズでのみ行われます。
    パーティションの数
    Oracleソース - 初期ロード、および初期ロードと増分ロードの組み合わせ
    SQL Serverソース - 初期ロード、および初期ロードと増分ロードの組み合わせ
    ソースオブジェクトのパーティション化を有効にする場合、作成するパーティションの数を入力します。デフォルト数は5です。最小値は2です。
    増分ロード操作の当初の開始点
    すべてのソース - 増分ロード
    ソースログ内の位置をカスタマイズする場合は、このフィールドを設定します。
    データベース統合
    ジョブは、最初に実行されたときに変更レコードの読み取りをこの位置から開始します。
    次のオプションがあります。
    • 利用可能で最も早い時間
      。変更が保存されているデータベースログまたはデータベース構造内で利用可能な最も早い位置。
      • DB2 for iの場合、現在のジャーナルの先頭。
      • Db2 for LUW の場合、このオプションは使用できません。
      • DB2 for z/OSの場合、トランザクションログで利用可能な最も古いレコード。
      • MongoDBの場合、このオプションは使用できません。
      • MySQLの場合、最初のbinlogファイルで使用可能な最も古いレコード。
      • Oracleの場合、このオプションは使用できません。
      • PostgreSQLの場合、レプリケーションスロットで利用可能な最も古いレコード。
      • SAP HANAおよびSAP HANA Cloudの場合、PKLOGテーブルで使用可能な最も古いレコード。
      • SQL Serverの場合、アクティブなトランザクションログで利用可能な最も古いレコード。
        [メソッド]
        [クエリベースのCDC]
        に設定されている場合、このオプションは使用できません。
    • 使用可能な最新
      。データベースログまたはデータベース構造内で利用可能な最新の位置。
    • 位置
      。データベース取り込みジョブが変更レコードの取得を開始する変更ストリーム内の位置。位置の値は、Db2 for iタイムスタンプ、Db2 for z/OS LRSN、Oracle SCN、PostgreSQL LSN、SAP HANAシーケンス値、またはSQL Server LSNです。この値は、現在の位置の値と同じかそれ以下にする必要があります。値が無効な場合、ジョブは失敗します。デフォルトでは値0が表示され、それが次の開始位置になります。
      • Db2 for iの場合、デフォルト値の0を使用しないでください。
      • Db2 for LUW の場合、このオプションは使用できません。
      • Db2 for z/OSの場合、値0を指定すると、使用可能な最新のポイントが使用されます。
      • MongoDBとMySQLの場合、このオプションは使用できません。
      • Oracleの場合、値0を指定すると、使用可能な最新のポイントが使用されます。
        [メソッド]
        [クエリベースのCDC]
        に設定されている場合、このオプションは使用できません。
      • PostgreSQLの場合、値0を指定すると、使用可能な最も古いポイントが使用されます。
      • SAP HANAの場合、値0を指定すると、使用可能な最も古いポイントが使用されます。
      • SQL Serverの場合、値0を指定すると、使用可能な最も古いポイントが使用されます。アクティブなトランザクションログの開始より前のゼロ以外のLSNの場合、データはトランザクションログからではなくCDCテーブルから読み取られます。
        [メソッド]
        [クエリベースのCDC]
        に設定されている場合、このオプションは使用できません。
    • 特定の日付と時刻
      一括取り込みデータベース
      が、変更レコードの取得を開始する変更ストリーム内の位置を決定するために使用する、MM/DD/YYYY
      hh:mm AM|PM
      の形式の日付と時刻。
      一括取り込みデータベース
      はこの日時より後に開始された変更のみを取得します。使用可能なアーカイブログに最も早い日付と時刻より前の日付と時刻を入力すると、ジョブは失敗します。
      MySQLソースの場合、このオプションは使用できません。
    デフォルトは
    [使用可能な最新]
    です。
    • [増分ロード操作の当初の開始点]
      オプションは、ジョブの最初の実行にのみ関連します。その後、停止または強制終了されたジョブを再開すると、ジョブは最後に中断したところからソースデータのプロパゲートを開始します。
    • トランザクションログでログベースのCDCを使用するSQL Serverの増分ロードジョブの場合、要求されたLSNが使用可能なときは、トランザクションログのアクティブな部分からデータ変更が読み取られます。LSNがアクティブなトランザクションログよりも前の場合、データの変更は以前に有効化されていたCDCテーブルから読み取られます。ソーステーブルでSQL Server CDCが有効になっていることを確認してください。
    • 初期ロードと増分ロードの組み合わせジョブの場合、初期ロードは、変更データの増分処理が現在のトランザクションログの末尾に到達するまで実行されません。
    取得サイズ
    MongoDB - 初期ロードと増分ロード
    MongoDBソースの場合、
    データベース統合
    ジョブがソースから一度に読み取る必要があるレコードの数。有効な値は1~2147483647です。デフォルトは5000。
  15. [カスタムプロパティ]
    で、特別な要件を満たすためにInformaticaが提供するカスタムプロパティを指定できます。プロパティを追加するには、
    [プロパティの作成]
    フィールドに、プロパティの名前と値を入力します。次に、
    [プロパティの追加]
    をクリックします。
    これらのプロパティを指定する場合は、Informaticaグローバルカスタマサポートにお問い合わせください。通常、これらのプロパティは、固有の環境または特別な処理のニーズに対応します。必要に応じて、複数のプロパティを指定できます。プロパティ名には、英数字と次の特殊文字のみを含めることができます: ピリオド(.)、ハイフン(-)、およびアンダースコア(_)。
    プロパティを削除するには、リストのプロパティ行の右端にある[削除]アイコンをクリックします。
  16. [次へ]
    をクリックします。