Hi, I'm Ask INFA!
What would you like to know?
ASK INFAPreview
Please to access Ask INFA.

目次

Search

  1. はじめに
  2. データプロファイリング
  3. プロファイル
  4. プロファイル結果
  5. データプロファイリングタスクのパフォーマンスチューニング
  6. トラブルシューティング

データプロファイリング

データプロファイリング

プロファイル設定

プロファイル設定

プロファイル実行に対してサンプリングオプションを選択できます。また、プロファイル結果をドリルダウンするかどうかも選択できます。
以下の表に、
[プロファイル設定]
領域で選択できるオプションの一覧を示します。
プロパティ
説明
次に対してプロファイルを実行
プロファイルを実行するためのサンプリングオプションを、次のいずれかから選択します。
  • [すべての行]。プロファイルはソースオブジェクトのすべての行に対して実行されます。
  • [最初の
    n
    行]。プロファイルはソース内の最初の
    n
    個の行数に対して実行されます。
  • ランダムサンプル
    n
    行。プロファイルは、設定された数のランダムな行で実行されます。
ドリルダウン
次のいずれかのドリルダウンオプションを選択します。
  • プロファイル結果をドリルダウンして特定のデータを表示する場合は、
    [オン]
    を選択します。プロファイリング結果でデータ型、パターン、または値を選択すると、
    データプロファイリング
    によって関連するデータが
    [データプレビュー]
    領域に表示されます。このオプションを選択した場合は、プロファイルの実行後にソースオブジェクトに対するクエリを実行できます。
  • ソースオブジェクトをドリルダウンしない場合は、
    [オフ]
    を選択します。
ソースオブジェクトをドリルダウンしてクエリを実行するには、
データプロファイリング
のデータプレビュー特権が必要です。
Amazon S3およびAzure Data Lake Store接続でAvroまたはParquetソースオブジェクトを選択した場合、プロファイル結果またはクエリをドリルダウンすることはできません。
次の表に、接続とサポートされているサンプリングオプションを示します。
接続
サンプリングオプション
Amazon Athena
すべての行
最初のN行
Amazon Redshift V2
すべての行
ランダムN行
Amazon S3 V2
すべての行
Azure Data Lake Store Gen2
すべての行
Databricks Delta
すべての行(データ統合サーバーおよび詳細モードの実行)
サンプルN行(データ統合サーバーの実行)
フラットファイル
すべての行
Google Big Query V2
すべての行
Google Cloud Storage V2
すべての行
JDBC V2
すべての行
最初のN行
マップレット
すべての行
Microsoft Azure Synapse SQL
すべての行
最初のN行
ランダムN行
Microsoft Fabricデータウェアハウス
すべての行
最初のN行
ODBC
すべての行
[最初のN行]。ODBC接続経由のPostgresおよびIBM DB2データソースの場合。
Oracle
すべての行
最初のN行
PostgreSQL
すべての行
最初のN行
SAP BW Reader
すべての行
SAPテーブル
すべての行
データソースからランダムな数の行を取得するには、ソース接続の詳細オプションで、
[取得する行数]
オプションを設定します。
SQL Server
すべての行
最初のN行
Salesforce
すべての行
最初のN行
Snowflake Data Cloud
すべての行
最初のN行
ランダムN行
Databricksプロファイルを詳細モードで実行するには、詳細クラスタにアクセスできることを確認します。