Hi, I'm Ask INFA!
What would you like to know?
ASK INFAPreview
Please to access Ask INFA.

目次

Search

  1. はじめに
  2. データプロファイリング
  3. プロファイル
  4. プロファイル結果
  5. データプロファイリングタスクのパフォーマンスチューニング
  6. トラブルシューティング

データプロファイリング

データプロファイリング

スコアカードの表示

スコアカードの表示

スコアカードを使用して、データ品質スコアを測定し、既存のプロファイルおよび新規のプロファイルのデータ品質の進捗状況を監視します。
[スコアカードを表示]
ボタンをクリックして、
データガバナンスとカタログ
のスコアカードダッシュボードを表示します。
次の表に、スコアカードダッシュボードで表示できるウィジェットを示します。
ウィジェット
説明
次元別の最新の平均スコア
ディメンションに基づいて最新のデータ品質スコアの平均が表示されるドーナツグラフ。スコアは小数点以下2桁に四捨五入されます。
次元別のルールオカレンスの数
Good、Acceptable、およびNot Acceptableのしきい値に基づく各次元のルールオカレンスの数。
ルールオカレンス
ルールオカレンスの次の詳細を表示します。
  • 最新のデータ品質スコア
  • ルール仕様の次元
  • 最新プロファイルの実行日時
  • 処理された行の合計数
  • 失敗した行の合計数
  • 入力カラムまたはプライマリデータ要素
  • 有効な行と失敗した行をプレビューします。有効な行または失敗した行をプレビューするには、ルールオカレンスにカーソルを合わせ、省略記号ボタンをクリックします。次に、
    [有効な行のプレビュー]
    または
    [失敗した行のプレビュー]
    オプションを選択します。
ルールオカレンスを使用してデータプロファイリングタスクを実行するたびに、スコアカードダッシュボードのスコアが更新されます。ルールオカレンスを定義してプロファイルを実行しなかった場合、スコアカードダッシュボードにはルールオカレンスがスコアなしで表示されます。
  • スコアカードは、プロファイリングソースに基づいて作成されます。別のソースからのルールオカレンスを使用してスコアカードを作成する場合は、
    データガバナンスとカタログ
    を使用する必要があります。
  • 複数の入力ポートがあるルールを持つルールオカレンスでデータプロファイリングタスクを実行すると、スコアカードダッシュボードには、入力ポートからランダムに選択された1つのカラムのみに対応するスコアが表示されます。
  • ルールオカレンスに複数の入力ポートが関連付けられている場合、スコアカードダッシュボードの
    [プライマリデータ要素]
    には、入力ポートにリンクされているソースのカラム名がランダムに表示されます。例えば、
    in_input1
    in_input2
    などの複数の入力ポートを持つ
    rs_compare_string
    という名前のルールを使用してルールオカレンスを作成したとします。この状態で、FIRSTNAMEカラムを入力ポート
    in_input1
    にリンクし、LASTNAME列を入力ポート
    in_input2
    リンクすると、スコアカードダッシュボードに
    [プライマリデータ要素]
    がランダムに表示されます。この場合、FIRSTNAMEまたはLASTNAMEのいずれかが表示されます。

データアナリストがCustomerテーブルでプロファイルを作成して実行します。最新のプロファイル実行で利用可能なデータの有効性を確認する必要があります。
以下のタスクを実行できます。
  1. Data Quality
    で適切なルールロジックを使用してルール仕様を作成し、次元を
    有効
    に設定します。
    有効
    な次元をルールに適用すると、出力データは定義されたビジネスルールに準拠し、それらのルールの適用時に許容されるパラメータの範囲内に収まります。
  2. プロファイルを作成し、ルール仕様を関連付けます。
  3. スコアリングの対象となるGood、Acceptable、およびNot Acceptableのしきい値を使用して、ルール仕様にルールオカレンスを作成します。
  4. プロファイルを保存して実行します。
  5. データガバナンスとカタログ
    のスコアカードダッシュボードにメトリックを表示します。メトリックを使用して、Customerテーブルのデータ品質の進捗状況を確認できます。

関係者情報の表示

ルールオカレンスの関係者として指定されているユーザーを、
データガバナンスとカタログ
[概要]
[関係者]
タブで確認できます。関係者とは、ルールオカレンスを担当し、オカレンスへの変更要求を承認または拒否し、ルールオカレンスのプロパティに入力し、アセットを追跡して変更を監視する権限があるユーザーのことです。
ルールオカレンスを作成するユーザーは、その特定のルールオカレンスの関係者として割り当てられます(ただし、そのユーザーのユーザーロールに、必要な権限が付与されている場合)。関係者をルールオカレンスに割り当てるには、組織管理者が、ユーザーロールに対して
データガバナンス管理者
特権を有効にする必要があります。
関係者の詳細については、
データガバナンスとカタログ
ドキュメントにある、
アセットの詳細
アセットの操作
に関する説明を参照してください。

スコアのステータス変更の通知の表示

ルールオカレンスに対してスコアのステータス変更がある場合は、
データガバナンスとカタログ
でアラートまたは通知が生成されます。ルールオカレンスのステータスの変更については、アプリケーション通知を表示し、電子メール通知を受け取ることができます。電子メール通知を設定するには、設定リンク( 歯車のアイコン 
			 )を
[通知]
ページで開いたあと、
[データ品質]
通知タイプの
[電子メールサマリ]
[電子メールイベント]
オプションを有効にします。
ルールオカレンスに対する次の変更については、通知を受け取ることができます。
  • 正常から許容不可へのステータス変更
  • 許容可能から許容不可へのステータス変更
  • 正常から許容可能へのステータス変更
ルールオカレンスの関係者として割り当てられているユーザーまたはユーザーグループが通知を受け取ります。
ガバナンス管理者
ロールのユーザーは、自分が作成したルールオカレンスの関係者として割り当てられます。
カスタムロールを持つユーザーを関係者として追加する場合は、ユーザーが次の権限と特権に関する条件を満たしていることを確認する必要があります。
  • メタデータコマンドセンターサービスのデータ品質アセットに対する作成、読み取り、更新、および削除の権限を有効にする。
  • データガバナンスとデータカタログサービスの
    [関係者]
    機能を有効にする。
スコアのステータスに関する通知の詳細については、
データガバナンスとカタログ
ドキュメントにある、
アセットの操作
に関する説明を参照してください。

ルールオカレンスの行とメトリックのダウンロード

ルールオカレンスの行とメトリックは、
データガバナンスとカタログ
のスコアカードダッシュボードからダウンロードできます。最大100行を区切りファイルと凡例ファイルにダウンロードできます。行をダウンロードするには、
[有効な行のプレビュー]
ウィンドウでダウンロードリンクをクリックします。