目录

Search

  1. 前言
  2. 第 部分: 1: Data Discovery 简介
  3. 第 部分: 2: 使用 Informatica Analyst 的 Data Discovery
  4. 第 部分: 3: 使用 Informatica Developer 执行数据发现
  5. 附录 , A: 基于剖析仓库连接的功能支持

Data Discovery 指南

Data Discovery 指南

列配置文件概念概览

列配置文件概念概览

列配置文件可确定数据源中列的特性,如值频率、百分比和模式。
列剖析发现数据的以下相关情况:
  • 每个列中的空值、相异值和非相异值的个数,用数字和百分比表示。
  • 每个列中数据的模式以及这些值出现的频率。
  • 有关列值的统计信息,例如,每个列中值的最大和最小长度,以及第一个值和最后一个值。
  • 记录的数据类型、推理的数据类型以及两者之间的潜在冲突。
  • 模式离群值和值频率离群值。
创建或编辑配置文件时可以配置以下选项:
  • 列配置文件选项。您可以选择要在上面运行配置文件的列,以及选择采样选项和向下钻取选项。
  • 添加、编辑或删除筛选器和规则。
在配置文件结果中,可以向配置文件和配置文件中的列添加注释和标记。可以为列分配业务术语。
模型存储库会使用存储库配置文件锁定来锁定配置文件,以防止用户覆盖所做的工作。版本控制系统会保存配置文件的多个版本,并为每个版本分配一个版本号。可以先签出配置文件,然后在进行更改后再签入配置文件。重新签入配置文件之前,可以撤消配置文件的签出操作。
创建结果卡以定期查看数据质量。在为配置文件应用规则之前和之后均需创建结果卡,以便查看列中有效值的图形表示形式。
使用计划程序服务调度配置文件运行和结果卡运行,以便在特定时间或间隔运行。计划程序服务会管理配置文件、结果卡、已部署映射和已部署工作流的计划。您可以在 Informatica Administrator 中创建、管理和运行计划。