Hi, I'm Ask INFA!
What would you like to know?
ASK INFAPreview
Please to access Ask INFA.

目次

Search

  1. はじめに
  2. データプロファイリング
  3. プロファイル
  4. プロファイル結果
  5. データプロファイリングタスクのパフォーマンスチューニング
  6. トラブルシューティング

データプロファイリング

データプロファイリング

インサイトの確認と実行

インサイトの確認と実行

CLAIREエンジンによって生成された、推測されたインサイトは、
データプロファイリング
で確認できます。インサイトにマウスを合わせて、インサイトを承認または拒否します。インサイトを確認したら、プロファイルを保存して実行する必要があります。
クリック操作を または アイコンに対して行い、インサイトを承認または拒否します。インサイトを承認すると、
Data Quality
でルール仕様がに作成され、ルールがプロファイルに自動的に割り当てられます。承認後、インサイトのステータスは「承認済み、保留中」に変わります。プロファイルを保存すると、インサイトのステータスが「承認済み」に変わります。ルール仕様が自動的に作成され、インサイトが参照されるカラムの
[ルール]
タブに表示されます。ステータスとルールの関連付けを保持するため、プロファイルは保存する必要があります。インサイトが承認された後は、対応するルール仕様をプロファイルの
[ルール]
タブから削除しない限り、インサイトをプロファイルから削除することはできません。
インサイトを承認すると、インサイトに対応するカラムの品質を監視するルール仕様が作成されます。例えば、値の頻度の長さに基づいて外れ値を検出するアルゴリズムです。CLAIREでは、長さが5を超える値の頻度は無効にすることをお勧めします。5より大きい値を検証し、それらに無効のタグを付けるロジックを使用して、新しいルール仕様が自動的に作成されます。ルール仕様も、プロファイルのカラムに自動的に割り当てられます。
次の図は、
[ルール]
タブでの、プロファイルの対応するソースカラムに割り当てられた、自動的に作成されたルール仕様を示しています。
  • 自動的に作成されるルールの名前は、rs_<ソースカラム名>_<インサイトタイプ>_<連番>というパターンで表されます。
  • 自動的に作成されたルールの説明には、「CLAIREにより推奨」というテキストが追加されます。
インサイトを拒否すると、インサイトのステータスが「拒否、保留中」に変わります。拒否を完了するには、プロファイルを保存する必要があります。プロファイルを保存すると、インサイトのステータスが「不承認」に変わります。
複数のインサイトステートメントを確認するには、インサイトを選択して、 または アイコン([インサイト]領域の上部)をクリックします。
保留中のインサイトのレビューはリセットできます。「承認済み、保留中」または「拒否、保留中」ステータスのインサイトはクリアできます。インサイトにマウスを合わせて アイコンをクリックし、レビューをリセットします。インサイトのステータスが消えます。クリック操作を アイコン([インサイト]領域の上部)をクリックして、保留中のインサイトをすべてリセットします。
[拒否されたインサイトを非表示]
チェックボックスを選択すると、拒否されたすべてのインサイトを非表示にすることができます。
インサイトが承認または拒否されると、同じアルゴリズムが同じカラムに対して再度使用されることはありません。
推測されたインサイトを確認した後、ドリルダウンして、異常なデータ値や複雑な不整合を
[結果]
タブで確認できます。プロファイルの結果の詳細については、プロファイル結果を参照してください。ルールオカレンスを作成し、スコアカードを表示して、データ品質スコアを測定し、プロファイルのデータ品質の進捗状況を監視することもできます。ルールオカレンスとスコアカードの詳細については、ルールオカレンスとスコアカードを参照してください。