目次

Search

  1. はじめに
  2. Informatica Data Engineering Integrationについて
  3. マッピング
  4. マッピングの最適化
  5. ソース
  6. ターゲット
  7. トランスフォーメーション
  8. Pythonトランスフォーメーション
  9. データプレビュー
  10. クラスタワークフロー
  11. プロファイル
  12. 監視
  13. 階層データ処理
  14. 階層データ処理設定
  15. スキーマが変更された階層データの処理
  16. インテリジェント構造モデル
  17. ブロックチェーン
  18. ステートフルコンピューティング
  19. 付録 A: 接続リファレンス
  20. 付録 B: データ型リファレンス
  21. 付録 C: 関数リファレンス

ユーザーガイド

ユーザーガイド

サンプリングオプション

サンプリングオプション

サンプリングオプションでAnalystツールまたはDeveloper toolによってプロファイルを実行するときの行数を指定します。サンプリングオプションは、プロファイルを定義またはプロファイルを実行するときに設定できます。
以下の表に、プロファイルのサンプリングのオプションを示します。
サンプリングオプション
説明
すべての行
データオブジェクト内のすべての行にプロファイルを実行します。
ネイティブ、Blaze、およびSparkランタイム環境でサポートされます。
最初の<number>行をサンプリング
データオブジェクト内の最初の行からサンプル行にプロファイルを実行します。行は最大で2,147,483,647行まで選択できます。
ネイティブおよびBlazeランタイム環境でサポートされます。
<number>行のランダムサンプリング
データオブジェクト内のランダムに選択した一定数の行にプロファイルを実行します。行は最大で2,147,483,647行まで選択できます。
ネイティブおよびBlazeランタイム環境でサポートされます。
ランダムサンプリング(自動)
データオブジェクト内の行数に基づいて計算された数のサンプル行にプロファイルを実行します。
ネイティブおよびBlazeランタイム環境でサポートされます。
Limit n <number>行
データオブジェクト内の行数に基づいてプロファイルを実行します。Hadoop検証環境でのプロファイルの実行を選択した場合、Sparkエンジンはデータオブジェクトの複数のパーティションからサンプルを収集し、そのサンプルを1つのノードにプッシュして、サンプルサイズを計算します。Limit nサンプリングオプションでは、Oracle、SQL Server、およびDB2データベースがサポートされます。Limit nサンプリングオプションを設定した詳細フィルタは適用できません。
Sparkランタイム環境でサポートされます。
ランダムパーセンテージ
データオブジェクト内の一定割合の行にプロファイルを実行します。
Sparkランタイム環境でサポートされます。
以降のプロファイル実行で、データ型とデータドメイン推測から、承認済みのデータ型とデータドメインを除外します。
次回のプロファイル実行で、データ型とデータドメイン推測から、承認済みのデータ型とデータドメインを除外します。