Hi, I'm
A
sk
I
NFA!
What would you like to know?
A
SK
I
NFA
Preview
Please
log in
to access Ask INFA.
Communities
A collaborative platform to connect and grow with like-minded Informaticans across the globe
Product Communities
Connect and collaborate with Informatica experts and champions
Discussions
Have a question? Start a Discussion and get immediate answers you are looking for
User Groups
Customer-organized groups that meet online and in-person. Join today to network, share ideas, and get tips on how to get the most out of Informatica
Get Started
Community Guidelines
Knowledge Center
Troubleshooting documents, product guides, how to videos, best practices, and more
Knowledge Base
One-stop self-service portal for solutions, FAQs, Whitepapers, How Tos, Videos, and more
Support TV
Video channel for step-by-step instructions to use our products, best practices, troubleshooting tips, and much more
Documentation
Information library of the latest product documents
Velocity (Best Practices)
Best practices and use cases from the Implementation team
Learn
Rich resources to help you leverage full capabilities of our products
Trainings
Role-based training programs for the best ROI
Certifications
Get certified on Informatica products. Free, Foundation, or Professional
Product Learning Paths
Free and unlimited modules based on your expertise level and journey
Resources
Library of content to help you leverage the best of Informatica products
Tech Tuesdays Webinars
Most popular webinars on product architecture, best practices, and more
Product Availability Matrix
Product Availability Matrix statements of Informatica products
SupportFlash
Monthly support newsletter
Support Documents
Informatica Support Guide and Statements, Quick Start Guides, and Cloud Product Description Schedule
Product Lifecycle
End of Life statements of Informatica products
Ideas
Events
Change Request Tracking
Marketplace
日本語
English
英語
Español
スペイン語
Deutsch
ドイツ語
Français
フランス語
日本語
日本語
한국어
韓国語
Português
ポルトガル語
中文
中国語
ログイン
サインアップ
Data Profiling
Current Version
Current Version
データプロファイリング
更新済み: September 2025
Data Profiling
Data Profiling
所有产品
Rename Saved Search
Name
* This field is required
Overwrite saved search
Confirm Deletion
Are you sure you want to delete the saved search?
目次
Search
No Results
はじめに
データプロファイリング
データプロファイリングタスク
前提条件
ユーザーとユーザーグループの作成
権限と特権の割り当て
接続の作成
Amazon Athena
Amazon Redshift V2
Amazon S3
Azure Data Lake Storage Gen2
Databricks Delta
フラットファイル接続
Google BigQuery V2接続
Google Cloud Storage V2
JDBC V2
MariaDB
Microsoft Azure Synapse SQL
Microsoft Fabricデータウェアハウス
Microsoft SQL Server接続
MySQL
ODBC接続
Oracle接続
Oracle Cloud Object Storage
PostgreSQL
Salesforce接続
SAP BW
SAP HANA
SAPテーブル
Snowflake Data Cloud
ソースマップレット
プロジェクトとフォルダの作成
データプロファイリングREST API
プロファイル
プロファイル定義
アセットの詳細
ソースの詳細
形式オプション
詳細オプション
プロファイル設定
カラム
カラムメタデータのオーバーライド
フィルタ
フィルタの作成
プロファイル実行へのフィルタの追加
データプレビュー
ルール
プロファイルへのルールの追加
プロファイルへのルールの追加
ソースオブジェクトに対する自動ルール関連付け
ルールオカレンスとスコアカード
ルールオカレンスを作成し、スコアカードを表示するための一般的な前提条件
ルールオカレンスを作成するための前提条件
スコアカードを表示するための前提条件
ルールオカレンスの作成
スコアカードの表示
スケジュールおよび詳細オプション
スケジュールの詳細
ランタイム環境
電子メール通知オプション
詳細オプション
実行モード
セッションのオプション
インサイト
インサイトの生成
表示オプション
インサイト
インサイトステータス
インサイトの確認と実行
プロファイリングタスクの作成
例外管理タスク
プロファイルのエクスポート
エクスポートファイル
プロファイルのエクスポート
プロファイルのインポート
プロファイルのインポート
プロファイル結果
プロファイル実行のプロファイル結果の表示
階層カラムのツリープレビューアの表示
プロファイルの編集
ソースオブジェクトから抽出される統計
クエリ
クエリの作成および実行
プロファイル実行の選択
プロファイル実行の選択
プロファイル実行の比較
プロファイル実行の比較
実行結果の比較
プロファイルのカラムの比較
実行における複数のカラムの比較
カラム結果の比較
プロファイル結果のエクスポート
ファイルへのプロファイル結果のエクスポート
ファイルにエクスポートしたプロファイル結果の表示
ディクショナリへの値の頻度のエクスポート
ディクショナリへのカラム値のエクスポート
エクスポートされたカラム値のディクショナリでの表示
プロファイルジョブ
プロファイルのプロファイル実行の削除
データプロファイリングタスクのパフォーマンスチューニング
Secure Agentの並行処理の設定
FAQ(よくある質問)
トラブルシューティング
データプロファイリングタスクのトラブルシューティング
Help for Users
データプロファイリング
データプロファイリングタスクのパフォーマンスチューニング
FAQ(よくある質問)
データプロファイリング
データプロファイリング
前へ
次へ
FAQ(よくある質問)
FAQ(よくある質問)
[カラムあたりの分割処理の最小行数]と[マッピングあたりの最大カラム数]のデフォルト値を使用するとパフォーマンスが低下することがあります。
データプロファイリング
タスクのパフォーマンスを向上させるにはどうすればいいですか。
この問題は、行数が100,000,000未満でカラム数が50を超える大規模なデータソースで発生する可能性があります。この場合、
データプロファイリング
ではカラムベースの基準が選択され、50個のカラムにつき1つのサブタスクが作成されます。これにより、多くのメモリと処理能力が使用されます。
この問題を解決するには、
[カラムあたりの分割処理の最小行数]
オプションの値を大きくし、
[マッピングあたりの最大カラム数]
オプションの値を小さくします。
例えば、データソースに10,000,000個の行と100個のカラムが含まれている場合、
データプロファイリング
タスクでは、デフォルトの設定を使用して2つのサブタスクが作成されます。これにより、多くのメモリが使用されて実行時間が長くなります。この場合、
[カラムあたりの分割処理の最小行数]
のデフォルト値をそのまま使用し、
[マッピングあたりの最大カラム数]
オプションを25に設定することができます。
データプロファイリング
で4つのサブタスクが作成され、パフォーマンスとリソース使用率が最適化されます。また、Secure Agentの並行処理をデフォルトの2から(n)に増やすこともできます(ここで、n = Secure Agentが実行されているマシンの整数(0.8*コア数))。
Secure Agentの並行処理を増やして
データプロファイリング
のパフォーマンスを最適化することはできますか。
はい、
データプロファイリング
タスクの詳細オプションに加えて、
データプロファイリング
のパフォーマンスに影響するSecure Agentの並行処理を設定できます。
例えば、データソースに10,000,000個の行と100個のカラムが含まれており、Secure Agentが実行されているマシンに4つのコアがあるとします。
パフォーマンスを最適化するには、次の手順を実行します。
Administratorで、
maxDTMProcesses
を値
n
に設定します(ここで、n = Secure Agentが実行されているマシンの整数(0.8*コア数))。この場合、
maxDTMProcesses
を3に設定します。
データプロファイリング
で、データソースのプロファイルを作成します。
[スケジュール]
ページで、
[マッピングあたりの最大カラム数]
を15に設定します。
プロファイルを保存して実行します。
この場合、
データプロファイリング
で7つのサブタスクが生成されます。
データソースに100個のカラムが含まれている場合に[マッピングあたりの最大カラム数]オプションを20に設定すると、[マイジョブ]タブに表示されるプロファイルのサブタスク数が8になります。必要以上のサブタスク数が表示されるのはなぜですか。
プロファイルを作成して実行すると、次のサブタスクが生成および実行されます。
ソース行数-<number_of_chosen_rows>のフェッチ。このタスクは、プロファイル実行につき1回のみ生成されます。
データプロファイリングマッピングの生成。このサブタスクは、プロファイル実行につき1回のみ生成されます。
s_profiling。生成されるサブタスクの数は、
[カラムあたりの分割処理の最小行数]
と
[マッピングあたりの最大カラム数]
の値に基づきます。この場合、5つのサブタスクが生成されます。
ステージング領域からメトリックストアへのデータのロード。このタスクは、プロファイル実行につき1回のみ生成されます。
この場合、タスクに対して作成されるサブタスクの総数は8になります。
プロファイルジョブに複数のマッピングサブタスクを作成する接続にはどのようなものがありますか。
以下は、プロファイルジョブに複数のマッピングサブタスクを作成する接続のリストです。
Oracle
SQL Server
フラットファイル
Azure Synapse SQL(ODBC)
Amazon Redshift V2
Snowflake Data Cloud
各プロファイルジョブによって作成されるマッピングサブタスクの数を確認するにはどうすればよいですか。
[マイジョブ]
タブにリストされているs_profilingジョブの数を確認します。s_profilingジョブを表示するには、
[マイジョブ]
タブの[サブタスク]リンクをクリックします。例えば、次の画像は、s_profilingジョブを含むサンプルの
[マイジョブ]
タブを示しています。
[停止するエラー数]フィールドの値に、拒否された行の合計数よりも小さい値が設定されている場合でも、プロファイルジョブが失敗しません。
この問題は、プロファイルジョブに複数のルールを適用した場合に発生します。
データプロファイリング
は、個々のルールによって拒否された行の最大数を考慮します。プロファイルジョブに複数のルールが含まれている場合、拒否された行の合計数が他のルールの合計ではなく、いずれかのルールの設定と競合すると、
データプロファイリング
によってエラー時にプロファイルジョブが停止されます。
プロファイルのソースオブジェクトまたは接続を変更した後、プロファイルに自動割り当てされたルールを表示できません。
データプロファイリング
では、プロファイルを編集および変更するときに、ルールが自動的に割り当てられることはありません。
自動ルール関連付け機能は、R36で作成したプロファイルでは機能しません。
2021.07.Mリリース(R37)で新しいプロファイルを作成した場合にのみ、
データプロファイリング
によってルールが自動的に関連付けられます。
プロファイルジョブが次の警告メッセージで完了します:
レコード長[]が行順序ありバッファ長[]より<ファイルの場所>に対して長くなっています。レコードは拒否されます。
この問題を解決するにはどうすればいいですか?
この問題を解決するには、エラーが解決するまで、[行順序ありのバッファの長さ]パラメータの値を増やします。パラメータは、プロファイルの
[スケジュール]
タブの
[詳細オプション]
セクションにあります。
行順序ありのバッファの長さは、区切られた固定幅のフラットファイルに使用されます。
行順序ありのバッファの長さをより簡単に計算するには、警告メッセージに表示されるレコード長の値の2の倍数に相当する値を増やします。
値の頻度の長さが[結果]ページの実際の値の頻度の長さよりも長いのはなぜですか?
この問題は、カラムデータにアポストロフィ(')などの特殊文字が含まれている場合に発生する可能性があります。この問題を解決するには、カラムデータから特殊文字を削除して、プロファイルを再実行します。
特定の行数に対してランダムサンプリングを使用してプロファイルを実行した場合、プレビュー内の成功した行と失敗した行の数にはスコアカードダッシュボードの正しい行数が表示されないのですか?
プロファイルの実行ではサンプリングオプションが優先されますが、ドリルダウン機能ではサンプリングオプションが優先されません。このため、プレビューに表示される成功した行と失敗した行の数は、スコアカードダッシュボードの
[ルールオカレンス]
テーブルに表示される行の総数と一致しません。
データプロファイリング
は、プロファイル定義から選択解除されたカラム、またはソースから削除されたカラムのインサイト検証が失敗すると、自動ルール仕様を作成します。これらのルールを削除できますか?
はい、これらのルールは
[エクスプローラ]
タブから手動で削除できます。
サーバーレスランタイム環境を使用してネイティブプロファイルを実行できますか?
はい。サーバーレスランタイム環境を使用してネイティブプロファイルを実行できます。ただし、Sparkプロファイルは実行できません。
サーバーレスランタイム環境で実行されるプロファイルに対して、ドリルダウンやクエリの実行を行えますか?
いいえ。サーバーレスランタイム環境で実行されるプロファイルに対してドリルダウンやクエリの実行を行うことはできません。
データプロファイリングタスクのパフォーマンスチューニング
行動
ガイドをダウンロード
ページをウォッチ
フィードバックを送信
リソース
コミュニティ
Knowledge Base
Success Portal
トップに戻る
前へ
次へ