Hi, I'm Ask INFA!
What would you like to know?
ASK INFAPreview
Please to access Ask INFA.

目次

Search

  1. はじめに
  2. データプロファイリング
  3. プロファイル
  4. プロファイル結果
  5. データプロファイリングタスクのパフォーマンスチューニング
  6. トラブルシューティング

データプロファイリング

データプロファイリング

詳細オプション

詳細オプション

特定のソースオブジェクトには、詳細オプションを設定できます。
Amazon Athena
次の表に、Amazon Athenaソースオブジェクトに設定できるオプションの一覧を示します。
プロパティ
説明
S3ファイルにAthenaクエリ結果を保存
Amazon S3ファイルにAmazon Athenaクエリ結果を保存するかどうかを指定します。Amazon S3ファイルにAmazon Athenaクエリ結果を保存する場合は、チェックボックスをオンにします。
Amazon Athenaクエリ結果はCSVファイル形式で保存されます。
デフォルトでは、
[S3ファイルにAthenaクエリ結果を保存]
のチェックボックスはオフになっています。
S3OutputLocation
Amazon Athenaクエリの結果を保存するAmazon S3ファイルの場所を指定します。
JDBC URL
接続プロパティの
S3OutputLocation
パラメータでAmazon S3ファイルの場所を指定することもできます。
接続プロパティおよび詳細ソースプロパティでAmazon S3の出力場所を指定した場合、Secure Agentでは詳細ソースプロパティで指定したAmazon S3の出力場所が使用されます。
取得サイズ
1回の結果セットの読み取りでAmazon Athenaから取得する行数を指定します。
デフォルトは10000です。
暗号化タイプ
Amazon S3ステージングディレクトリのデータを暗号化します。
以下の暗号化タイプを選択できます。
  • なし
  • SSE-S3
  • SSE-KMS
  • CSE-KMS
デフォルトはNoneです。
スキーマ名
ソースオブジェクトのスキーマ名を上書きします。
ソーステーブル名
指定したテーブル名で、メタデータで使用されているテーブル名を上書きします。
SQLクエリ
デフォルトのSQLクエリをオーバーライドします。
カラム名を二重引用符で囲みます。SQLクエリでは大文字と小文字が区別されます。Amazon AthenaデータベースでサポートされているSQL文を指定します。
SQLクエリでカラムを指定するときに、クエリのカラム名がマッピングのソースカラム名と一致するようにします。
Amazon S3 V2
次の表に、Amazon S3ソースオブジェクトに設定できるオプションの一覧を示します。
オプション
説明
ソースタイプ
データの読み取り元のソースのタイプ。
次のソースタイプを選択することができます。
  • ファイル
  • ディレクトリ
デフォルトは
[ファイル]
です。
ソースタイプの詳細については、 Source types in Amazon S3 V2 sourcesを参照してください。
フォルダパス
オプション。Amazon S3ソースファイルのバケット名またはフォルダパスを上書きします。該当する場合は、ソースファイルを含むフォルダー名を
<bucket_name>/<folder_name>
形式で含めます。
バケット名を指定せずに、
/<folder_name>
形式でスラッシュ(/)から始まるフォルダパスを指定した場合、このフォルダパスは接続プロパティで指定したフォルダパスに付加されます。
例えば、このプロパティでフォルダパスを
/<dir2>
と指定し、接続プロパティでフォルダパスを
<my_bucket1>/<dir1>
と指定すると、このフォルダパスは、
<my_bucket1>/<dir1>/<dir2>
形式で接続プロパティで指定したフォルダパスに付加されます。
ファイル名
オプション。Amazon S3ソースファイルの名前を上書きします。
ワイルドカード文字を許可
? および*のワイルドカード文字を使用して、詳細モードでマッピングを実行してAvroファイル、フラットファイル、JSONファイル、ORCファイル、またはParquetファイルからデータを読み取る際にフォルダパスまたはファイル名を指定します。
再帰的読み取りの有効化
フラットファイル、Avroファイル、JSONファイル、ORCファイル、およびParquetファイルに、再帰的読み取りオプションを使用します。再帰読み取りを使用して読み取るファイルは、同じメタデータを持っている必要があります。フォルダパスまたはファイル名にワイルドカード文字を指定する際は、再帰的読み取りを使用してください。再帰的読み取りを有効にするには、ソースタイプとして[ディレクトリ]を選択します。
増分ファイルロード
ディレクトリにソースファイルを増分ロードして、マッピングタスクが最後に実行されてから変更されたファイルのみを読み取って処理します。
ステージングディレクトリ
オプション。ローカルステージングディレクトリのパス。ユーザーがディレクトリに対する書き込み権限を持っていることを確認します。さらに、ファイル全体をステージングするのに十分な領域があることを確認します。デフォルトのステージングディレクトリは、Secure Agentをホストするマシンの/tempディレクトリです。
ディレクトリパスを指定すると、次の形式で指定したパーティションの数に応じてSecure Agentによりフォルダが作成されます:
InfaS3Staging<00/11><timestamp>_<partition number>
(ここで00は読み取り操作を表し、11は書き込み操作を表します)
例えば、
InfaS3Staging000703115851268912800_0
など(一時ファイルは新しいディレクトリ内に作成されます)。ソースプロパティのステージングディレクトリは詳細クラスタには適用されません。ただし、詳細設定のAmazon S3のステージングディレクトリを指定する必要があります。
詳細については、「Administrator」を参照してください。
Hadoopパフォーマンスチューニングオプション
オプション。このプロパティはAmazon S3 V2コネクタに適用できません。
圧縮形式
Amazon S3からデータを読み取るときにデータを圧縮解除します。
次の形式でのデータ解凍を選択できます。
  • なし
  • Gzip
デフォルトは[なし]です。
このプロパティにオプションが表示されていても、Amazon S3 V2コネクタはLzoおよびBzip2圧縮形式をサポートしません。
圧縮形式の詳細については、Data compression in Amazon S3 V2 sources and targetsを参照してください。
ダウンロードパートサイズ
Amazon S3オブジェクトのダウンロードパートサイズをバイト単位で指定します。
デフォルトは5 MBです。フラット形式タイプのファイルを読み取るマッピングを実行する場合は、このプロパティを使用します。
マルチパートダウンロードしきい値
Amazon S3オブジェクトを複数のパートに分けてダウンロードするための最小しきい値サイズ。
オブジェクトを複数のパートで並行してダウンロードするには、Amazon S3オブジェクトのファイルサイズが、このプロパティで指定した値よりも大きいことを確認してください。デフォルトは10MBです。
一時的な資格情報の期間
IAMユーザーが動的に生成された一時的な資格情報を使用してAWSリソースにアクセスできる期間。期間を秒単位で入力します。
デフォルトは900秒です。900秒より大きい値を設定する必要がある場合は、AWSコンソールで期間を最大12時間まで設定できます。設定後に、同じ期間をこのプロパティに入力してください。
Azure Data Lake Store Gen2
次の表に、Azure Data Lake Storeソースオブジェクトに対して設定できるオプションの一覧を示します。
オプション
説明
同時スレッド
オプション。Microsoft Azure Data Lake Storage Gen2からデータをロードするための同時接続数。サイズの大きいファイルを書き込む場合は、複数のスレッドを生成してデータを処理できます。サイズの大きいファイルを複数の小さい部分に分割するには、
[ブロックサイズ]
を設定します。デフォルトは4。最大値は10です。
ファイルシステム名のオーバーライド
オプション。デフォルトのファイル名をオーバーライドします。
ソースタイプ
データの読み取り元のソースのタイプ。
次のソースタイプを選択することができます。
  • ファイル
  • ディレクトリ
デフォルトは
[ファイル]
です。
ソースタイプの詳細については、Directory Source in Microsoft Azure Data Lake Storage Gen2 Sourcesを参照してください。
ワイルドカード文字を許可
?および*のワイルドカード文字を使用して、詳細モードでマッピングを実行してAvroファイル、フラットファイル、JSONファイル、ORCファイル、またはParquetファイルからデータを読み取る際にフォルダパスまたはファイル名を指定します。
ディレクトリのオーバーライド
オプション。データの書き込みに使用するMicrosoft Azure Data Lake Storage Gen2ディレクトリ。デフォルトはルートディレクトリです。ディレクトリが存在しない場合には、Secure Agentによって作成されます。実行時に指定されたディレクトリパスで、接続の作成時に指定されたパスが上書きされます。
ファイル名上書き
オプション。ターゲットオブジェクト。データの書き込み元のファイルを選択します。実行時に指定したファイルによって、オブジェクトに指定したファイルが上書きされます。
Block Size
オプション。サイズの大きいファイルまたはオブジェクトを、指定したブロックサイズの小さい部分に分割します。サイズの大きいファイルを書き込む場合は、ファイルを小さな部分に分割し、同時接続を設定して、データを並列処理するために必要な数のスレッドを生成することを検討してください。デフォルトは8MBです。
圧縮形式
オプション。データを圧縮してターゲットに書き込みます。フラットファイルを書き込むには、
Gzip
を選択します。
タイムアウト間隔
オプション。サーバーへの接続を試行するときに待機する秒数。指定した時間内に接続を確立できない場合、タイムアウトになります。
中間ディレクトリ
オプション。Secure Agentマシンのステージングディレクトリへのパス。
Microsoft Azure Data Lake Storeからデータを読み取るときにファイルをステージングするステージングディレクトリを指定します。ディレクトリに十分なスペースがあり、ディレクトリへの書き込み権限があることを確認します。
デフォルトのステージングディレクトリは
/tmp
です。
詳細クラスタに中間ディレクトリを指定することはできません。
増分ファイルロード
ディレクトリにソースファイルを増分ロードして、マッピングタスクが最後に実行されてから変更されたファイルのみを読み取って処理します。
再帰的読み取りの有効化
フラットファイル、Avroファイル、JSONファイル、ORCファイル、およびParquetファイルに、再帰的読み取りオプションを使用します。再帰読み取りを使用して読み取るファイルは、同じメタデータを持っている必要があります。フォルダパスまたはファイル名にワイルドカード文字を指定する際は、再帰的読み取りを使用してください。再帰的読み取りを有効にするには、ソースタイプとして[ディレクトリ]を選択します。
Google Cloud Storage
次の表に、Google Cloud Storageソースオブジェクトに対して設定できるオプションの一覧を示します。
オプション
説明
Google Cloud Storageパス
接続で指定したGoogle Cloud Storageパスをオーバーライドします。ソースがフラットファイルでない場合、このプロパティは必須です。次の形式を使用します:
gs://<バケット名>またはgs://<バケット名>/<フォルダ名>
ソースファイル名
オプション。ソーストランスフォーメーションで指定したGoogle Cloud Storageのソースファイル名をオーバーライドします。
ディレクトリから複数のファイルを読み取るための[ディレクトリである]オプションを設定する場合は適用されません。
ディレクトリ
[Google Cloud Storageのパス]プロパティで指定したフォルダで使用可能なすべてのファイルを読み取るには、このプロパティを選択します。
暗号化タイプ
データを復号化する方法。
以下のいずれかの暗号化タイプを選択できます。
  • Informatica Encryption
  • なし
デフォルトは[なし]です。
Snowflake Data Cloud
次の表に、Snowflake Data Cloudソースオブジェクトに対して設定できるオプションの一覧を示します。
オプション
説明
データベース
接続で指定されたデータベースをオーバーライドします。
スキーマ
接続で指定されたスキーマをオーバーライドします。
ウェアハウス
接続で指定されたSnowflakeウェアハウス名をオーバーライドします。
ロール
接続で指定されたユーザーに割り当てられたSnowflakeロールをオーバーライドします。
テーブル名
インポートされたSnowflake Data Cloudソーステーブルのテーブル名をオーバーライドします。
Amazon Redshift V2
次の表に、Amazon Redshift V2ソースオブジェクトに設定できるオプションの一覧を示します。
オプション
説明
S3バケット名
データのステージングに使用するAmazon S3バケットの名前。バケット名をフォルダパスで指定することもできます。
圧縮を有効にする
Amazon S3ステージングディレクトリのステージングファイルを圧縮します。Secure Agentがステージングファイルを圧縮すると、タスクのパフォーマンスが向上します。デフォルトではオンに設定されています。
ステージングディレクトリの場所
ローカルステージングディレクトリの場所。Secure Agentランタイム環境でタスクを実行する場合は、ランタイム環境の対応するSecure Agentマシンで使用可能なディレクトリパスを指定します。次の方法でディレクトリパスを指定します。
<staging directory>
例えば、
C:\Temp
です。このディレクトリに対する書き込み権限があることを確認してください。
詳細クラスタには適用されません。
一時的な資格情報の期間
IAMユーザーが動的に生成された一時的な資格情報を使用してAWSリソースにアクセスできる期間。期間を秒単位で入力します。デフォルトは900秒です。
900秒以上が必要な場合、AWSコンソールで期間を最大12時間まで設定できます。設定した後で、同じ期間をこのプロパティに入力してください。
暗号化タイプ
Amazon S3ステージングディレクトリのデータを暗号化します。以下の暗号化タイプを選択できます。
  • なし
  • SSE-S3
  • SSE-KMS
  • CSE-SMK
詳細クラスタで実行されるマッピングで使用できるのはSSE-S3暗号化のみです。
デフォルトは[なし]です。
S3ファイルのマルチパートダウンロード
大きなAmazon S3オブジェクトを複数パートに分けてダウンロードします。Amazon S3オブジェクトのファイルサイズが8MBを超える場合は、オブジェクトを複数パートに分けて同時にダウンロードできます。デフォルトは5 MBです。詳細クラスタには適用されません。
マルチパートダウンロードしきい値サイズ
Amazon S3オブジェクトを複数のパートに分けてダウンロードするための最大しきい値サイズ。デフォルトは5 MBです。詳細クラスタには適用されません。
スキーマ名
デフォルトのスキーマ名をオーバーライドします。
スキーマ名を使用する場合、カスタムクエリを設定することはできません。
ソーステーブル名
デフォルトのソーステーブル名をオーバーライドします。
ソースタイプに[複数のオブジェクト]または[クエリ]を選択した場合、[ソーステーブル名]オプションは使用できません。
Databricks Delta
次の表に、Databricks Deltaソースオブジェクトに対して設定できるオプションの一覧を示します。
オプション
説明
データベース名
接続で指定したデータベース名と、メタデータのインポート時に指定したデータベース名をオーバーライドします。
複数のオブジェクトから読み取りを行います。[接続プロパティ]でデータベース名を指定していることを確認します。
テーブル名
指定したテーブル名で、メタデータで使用されているテーブル名を上書きします。
SQLオーバーライド
Databricks Deltaカスタムクエリソースからデータの読み取りを行うために使用されるデフォルトのSQLクエリをオーバーライドします。
SQLオーバーライドクエリのカラム名は、SQLトランスフォーメーションのカスタムクエリのカラム名と一致している必要があります。
ソースのメタデータは、クエリをオーバーライドするためのSQLオーバーライドと同じである必要があります。
このオプションは、データ統合サーバーでプロファイリングタスクを実行するときに使用できます。
ステージングの場所
ステージングファイルストレージへの相対ディレクトリパス。
  • DatabricksクラスタがAWSにデプロイされている場合は、Amazon S3ステージングバケットに対する相対パスを使用します。
  • DatabricksクラスタがAzureにデプロイされている場合は、Azure Data Lake Store Gen2ステージングファイルシステム名に対する相対パスを使用します。
Unity Catalogを使用する場合は、ユーザーのクラウドストレージ上の既存の場所を[ステージング場所]で指定する必要があります。データ統合サーバーでプロファイリングタスクを実行する場合、Unity Catalogには[ステージングの場所]は必要ありません。
ジョブのタイムアウト
Sparkジョブが処理を完了するのに要する最大時間(秒単位)。指定された時間内にジョブが完了しない場合、Databricksクラスタでのジョブが終了し、マッピングは失敗します。
ジョブのタイムアウトが指定されていない場合、マッピングにはジョブの完了に基づいて[成功]または[失敗]と表示されます。
ジョブステータスのポーリング間隔
Secure Agentがジョブ完了のステータスをチェックするポーリング間隔の秒数。
デフォルトは30秒です。
DB REST APIタイムアウト
ネットワーク接続が原因でエラーが発生した場合、またはRESTエンドポイントがエラーコード
5xx HTTP
を返した場合に、Secure AgentがDatabricksへのREST API呼び出しを再試行する最大時間(秒単位)。
デフォルトは10分です。
DB REST API再試行の間隔
ネットワーク接続によるエラーが発生した場合、またはRESTエンドポイントがエラーコード
5xx HTTP
を返した場合に、Secure AgentがREST API呼び出しを再試行する必要がある時間間隔(秒単位)。
この値は、ジョブステータスREST APIには適用されません。ジョブステータスREST APIのジョブステータスポーリング間隔値を使用します。
デフォルトは30秒です。
JDBC V2
次の表に、JDBC V2ソースオブジェクトに対して設定できるオプションの一覧を示します。
オプション
説明
Pre SQL
ソースからデータの読み取りを行う前にSecure Agentが実行するSQLクエリ。
Post SQL
1
Secure Agentがソースからデータの読み取りを行った後に実行するSQLクエリ。
取得サイズ
Secure Agentが1回の呼び出しでデータベースから取得する行数。
テーブル名
指定したテーブル名で、メタデータで使用されているテーブル名を上書きします。
スキーマ名
ソースオブジェクトのスキーマ名をオーバーライドします。
接続プロパティおよびソースプロパティでスキーマ名を指定した場合、Secure Agentはソースプロパティで指定されたスキーマ名を使用します。
SQLオーバーライド
JDBC V2ソースからデータの読み取りを行うために使用されるデフォルトのクエリとオブジェクト名をオーバーライドするSQL文。
1
詳細モードのマッピングには適用されません。
Microsoft Azure Synapse SQL
次の表に、Microsoft Azure Synapse SQLソースオブジェクトに対して設定できるオプションの一覧を示します。
オプション
説明
Azure Blobコンテナ名
Microsoft Azure Blob Storageコンテナ名。接続プロパティでAzure Blobストレージを選択した場合は必須です。
ADLSファイルシステム名
Microsoft Azure Data Lake Storage Gen2のファイルシステムの名前。
接続プロパティでADLS Gen2ストレージを選択した場合は必須です。指定したファイルシステムの下のディレクトリのパスを指定することもできます。
スキーマ名のオーバーライド
接続で指定されたスキーマをオーバーライドします。
テーブル名のオーバーライド
インポートされたMicrosoft Azure Synapse SQLソーステーブルのテーブル名をオーバーライドします。
フィールド区切り文字
ファイル内のフィールドを区切るために使用する文字。デフォルト値は
0x1e
です。「TAB」または0-256の単一文字の印刷可能文字と、印刷できないASCII文字を指定できます。印刷できない文字は、16進数で指定する必要があります。
Blob Storeへの同時接続数
Microsoft Azure Blob Storageからデータを抽出するための同時接続数。サイズの大きいBlobを読み取る場合は、データを処理するために複数のスレッドを生成できます。
[BLOBパートサイズ]
を設定して、サイズの大きいBlobを小さいパートにパーティション化します。デフォルトは4。最大値は10です。
Blobパートサイズ
指定したサイズの小さいパートにBlobをパーティション化します。サイズの大きいBlobを読み取る場合は、Blobを小さいパートにパーティション化し、同時接続を設定して、データを並列処理するために必要なスレッド数を生成することを検討します。デフォルトは8MBです。
文字列の引用符
Secure Agentは、Microsoft Azure Synapse SQLからデータを読み取るときに、指定された文字をスキップします。デフォルト値は
0x1f
です。
中間ディレクトリ
オプション。Secure Agentマシンのステージングディレクトリへのパス。Microsoft Azure Synapse SQLからデータを読み取るときにファイルをステージングするステージングディレクトリを指定します。ディレクトリに十分なスペースがあり、ディレクトリへの書き込み権限があることを確認します。
デフォルトのステージングディレクトリは/tmpです。
詳細クラスタに中間ディレクトリを指定することはできません。
Microsoft Fabricデータウェアハウス
次の表に、Microsoft Fabric Data Warehouseソースオブジェクトに対して設定できるオプションの一覧を示します。
オプション
説明
スキーマ名のオーバーライド
接続で指定されたスキーマをオーバーライドします。
テーブル名の上書き
インポートされたMicrosoft Fabric Data Warehouseソーステーブルのテーブル名をオーバーライドします。
SQLオーバーライド
Microsoft Fabric Data Warehouseソースからデータの読み取りを行うために使用されるデフォルトのクエリとオブジェクト名をオーバーライドするSQL文。
Pre SQL
ソースからデータの読み取りを行う前にSecure Agentが実行するSQLクエリ。
Post SQL
Secure Agentがソースからデータの読み取りを行った後に実行するSQLクエリ。
Pre/Post SQLのエラー時の処理
実行前SQLまたは実行後SQLオプションを使用する場合は必須です。
[停止]を選択すると、エラーが発生した場合でも[SQL]クエリは実行されません。
[続行]を選択すると、SQLクエリはエラーに関係なく引き続き実行されます。
Microsoft SQL Server
次の表に、Microsoft SQL Serverソースオブジェクトに対して設定できるオプションの一覧を示します。
オプション
説明
スキーマ名
ソースオブジェクトのスキーマ名をオーバーライドします。
テーブル名
指定したテーブル名で、メタデータで使用されているテーブル名を上書きします。
トレースレベル
ログファイルに表示される詳細情報の量。[簡易]、[ノーマル]、[詳細 - 初期化]、または[詳細 - データ]から選択します。デフォルトは[ノーマル]です。
Pre SQL
ソースからデータの読み取りを行う前にSecure Agentが実行するSQLクエリ。
Post SQL
Secure Agentがソースからデータの読み取りを行った後に実行するSQLクエリ。
SQLオーバーライド
指定したソースタイプから生成されたデフォルトのクエリをオーバーライドするSQL文。
クエリで指定したカラムの数、カラムの順序、およびデータ型がMicrosoft SQL Serverソースオブジェクトと一致していることを確認してください。
ODBC
次の表に、ODBCソースオブジェクトに対して設定できるオプションの一覧を示します。
オプション
説明
スキーマ名
ソースオブジェクトのスキーマ名をオーバーライドします。
テーブル名
指定したテーブル名で、メタデータで使用されているテーブル名を上書きします。
トレースレベル
ログファイルに表示される詳細情報の量。[簡易]、[ノーマル]、[詳細 - 初期化]、または[詳細 - データ]から選択します。デフォルトは[ノーマル]です。
Pre SQL
ソースからデータの読み取りを行う前にSecure Agentが実行するSQLクエリ。
Post SQL
Secure Agentがソースからデータの読み取りを行った後に実行するSQLクエリ。
SQLオーバーライド
指定されたソースタイプから生成されたデフォルトのクエリをオーバーライドして、ODBCソースからデータを読み取るSQL文。
出力は確定的
入力データがセッション間で一貫しているときに、セッション間で変わらないリレーショナルソースまたはトランスフォーメーション出力。
このプロパティを設定するときに、パイプラインのトランスフォーメーションが常に再現可能なデータを生成する場合は、Secure Agentはリカバリのためにソースデータをステージングしません。
ソース出力がセッション実行間で変更されない場合にのみ指定します。
出力は再現可能
セッションの実行間で入力データの順序が同じ場合に、リレーショナルソースまたはトランスフォーメーション出力の順序が変わらないケースで選択します。
出力が決定的で繰り返し可能な場合、Secure Agentはリカバリのためにソースデータをステージングしません。
ソース出力の順序がセッション実行間で同じである場合にのみ指定します。
[なし]
または
[常時]
を選択します。
Oracle
次の表に、Oracleソースオブジェクトに対して設定できるオプションの一覧を示します。
オプション
説明
スキーマ名
ソースオブジェクトのスキーマ名をオーバーライドします。
テーブル名
指定したテーブル名で、メタデータで使用されているテーブル名を上書きします。
トレースレベル
ログファイルに表示される詳細情報の量。[簡易]、[ノーマル]、[詳細 - 初期化]、または[詳細 - データ]から選択します。デフォルトは[ノーマル]です。
Pre SQL
ソースからデータの読み取りを行う前にSecure Agentが実行するSQLクエリ。
Post SQL
Secure Agentがソースからデータの読み取りを行った後に実行するSQLクエリ。
SQLオーバーライド
指定されたソースタイプから生成されたデフォルトのクエリをオーバーライドして、Oracleソースからデータを読み取るSQL文。
出力は確定的
入力データがセッション間で一貫しているときに、セッション間で変わらないリレーショナルソースまたはトランスフォーメーション出力。
このプロパティを設定するときに、パイプラインのトランスフォーメーションが常に再現可能なデータを生成する場合は、Secure Agentはリカバリのためにソースデータをステージングしません。
ソース出力がセッション実行間で変更されない場合にのみ指定します。
出力は再現可能
セッションの実行間で入力データの順序が同じ場合に、リレーショナルソースまたはトランスフォーメーション出力の順序が変わらないケースで選択します。
出力が決定的で繰り返し可能な場合、Secure Agentはリカバリのためにソースデータをステージングしません。
ソース出力の順序がセッション実行間で同じである場合にのみ指定します。
[なし]
または
[常時]
を選択します。
Oracle Cloud Object Storage
次の表に、Oracle Cloud Object Storageソースオブジェクトに対して設定できるオプションの一覧を示します。
オプション
説明
フォルダパス
Oracle Cloud Object Storage接続のフォルダパスの値をオーバーライドします。
ファイル名
Oracle Cloud Object Storageソースファイルの名前をオーバーライドします。
ステージングディレクトリ
ローカルステージングディレクトリのパス。ユーザーがディレクトリに対する書き込み権限を持っていることを確認します。さらに、ファイル全体をステージングするのに十分な領域があることを確認します。デフォルトのステージングディレクトリは、Secure Agentをホストするマシンの
/temp
ディレクトリです。新しいディレクトリに一時ファイルが作成されます。
マルチパートダウンロードしきい値
Oracle Cloud Object Storageオブジェクトを複数のパートに分けてダウンロードするための最小しきい値サイズ。オブジェクトを複数のパートで並行してダウンロードするには、Oracle Cloud Object Storageオブジェクトのファイルサイズが、このプロパティで指定した値よりも大きいことを確認してください。
範囲
:
  • 最小: 4MB
  • 最大: 5GB
デフォルトは64MBです。
ダウンロードパートサイズ
Oracle Cloud Object Storageオブジェクトのパートサイズをバイト単位でダウンロードします。
範囲:
  • 最小: 4MB
  • 最大: 1GB
デフォルトは32 MBです。
PostgreSQL
次の表に、PostgreSQLソースオブジェクトに対して設定できるオプションの一覧を示します。
オプション
説明
Pre-SQL
ソースからデータの読み取りを行う前にSecure Agentが実行するSQLクエリ。
Post-SQL
Secure Agentがソースからデータの読み取りを行った後に実行するSQLクエリ。
取得サイズ
1つの結果セットでPostgreSQLデータベースから読み取る行数を指定します。
デフォルトは100000です。
スキーマ名
ソースオブジェクトのスキーマ名をオーバーライドします。
ソーステーブル名
デフォルトのソーステーブル名をオーバーライドします。
SQLオーバーライド
PostgreSQLソースからデータの読み取りを行うために使用されるデフォルトのクエリとオブジェクト名をオーバーライドするSQL文。
SAP BW
次の表に、SAP BWソースオブジェクトに対して設定できるオプションの一覧を示します。
オプション
説明
パケットサイズ(MB単位)
SAPがSecure Agentに送信するHTTPパケットのサイズ。単位はMBです。デフォルトは10MBです。
行のABAPのパッケージサイズ
SAPに一度に読み込まれバッファリングされる行数。デフォルトは1000行です。
圧縮を有効にする
選択すると、ABAPプログラムはデータをgzip形式で圧縮してから、Secure Agentに送信します。Secure AgentとSAPシステムが同一ネットワーク上に存在しない場合、この圧縮オプションを有効にしてパフォーマンスを最適化できます。デフォルトでは選択されていません。
SAPテーブル
次の表に、SAP ERPおよびSAP S/4 HANAソースオブジェクトに対して設定できるオプションの一覧を示します。
オプション
説明
取得される行数
SAPテーブルからランダムに取得される行の数。デフォルト値0の場合は、テーブルのすべての行が取得されます。
スキップされる行数
スキップされる行数。
パケットサイズ(MB単位)
パケットサイズ。デフォルトは10MBです。
データ抽出モード
次のモードのいずれかを使用して、SAPテーブルからデータを読み取ることができます。
  • ノーマルモード。このモードは、SAPテーブルから少量のデータを読み取る場合に使用します。
  • バルクモード。このモードは、SAPテーブルから大量のデータを読み取る場合に使用します。パフォーマンスを向上させるには、バルクモードを使用します。
データ抽出モードの詳細については、
SAPテーブルリーダーコネクタのパフォーマンスチューニングのガイドライン
に関するHow-Toライブラリの記事にある、Data Extraction modeのセクションを参照してください。
圧縮を有効にする
圧縮を有効にします。
Secure AgentとSAPシステムが同一ネットワーク上に存在しない場合、この圧縮オプションを有効にしてパフォーマンスを最適化できます。
更新モード
SAPテーブルからデータを読み取る際、差分抽出を実行するようマッピングを設定できます。使用する更新モードに基づき、次のオプションのいずれかを使用します。
  • 0 - フル。このオプションは、変更されたデータのみ読み取るのではなく、すべてのレコードをSAPテーブルから抽出する場合に使用します。
  • 1 - 転送なしの差分初期化。このオプションは、データの抽出はしないが、後に続く差分抽出に向けてInformaticaカスタムテーブル/INFADI/TBLCHNGNに最新の変更番号を記録する場合に使用します。
  • 2 - 転送ありの差分初期化。このオプションは、すべてのレコードをSAPテーブルから抽出して最初のデータセットを構築し、続けて差分更新セッションを実行して、変更されたデータをキャプチャする場合に使用します。
  • 3 - 差分更新。このオプションは、前回のデータ抽出以降に変更されたデータのみを読み取る場合に使用します。
  • 4 - 差分反復。このオプションは、前回の差分更新でエラーが発生し、その差分更新を反復する場合に使用します。
  • パラメータ。このオプションを選択すると、Secure Agentではパラメータファイルの更新モード値を使用します。
デフォルトは[0 - フル]です。
更新モードの詳細については、SAPコネクタヘルプの「差分抽出セクションの更新モード
」セクションを参照してください。
更新モード用のパラメータ名
パラメータファイルで更新モード用に定義したパラメータ名。
差分抽出用のテーブル名の上書き
SAPテーブル名を、CDPOSテーブルの構造名でキャプチャした差分レコードを抽出するSAP構造名で上書きします。