目录

Search

  1. Data Discovery 简介
  2. 使用 Informatica Analyst 的 Data Discovery
  3. 使用 Informatica Developer 执行数据发现

Data Discovery 指南

Data Discovery 指南

剖析概览

剖析概览

使用剖析查找应用程序、架构或企业的数据源的内容、质量和结构。数据源内容包括值频率和数据类型。数据源结构包括键和功能相关性。
在发现过程中,可以创建并运行配置文件。配置文件是一个存储库对象,可查找和分析企业内数据源中的所有数据不规范问题和使数据项目处于危险中的隐藏数据问题。通过在企业内的任何数据源中运行配置文件,可以很好地了解企业数据和元数据的优势和劣势。
可以使用 Informatica Analyst 和 Informatica Developer 分析源数据和元数据。分析人员和开发人员可以使用这些工具进行协作、识别数据质量问题以及分析数据关系。您可以根据自己的职位选择使用 Analyst 工具或 Developer tool 的功能。您可以执行的剖析度因使用工具的不用而有所不同。
您可以在 Developer tool 和 Analyst 工具中执行以下任务:
  • 执行列剖析。该过程包括发现列中唯一值、空值和数据模式的数量。
  • 执行数据域发现。您可以发现企业内的关键数据特性。
  • 管理配置文件结果,包括数据类型、数据域、主键和外键。
  • 创建结果卡以监视数据质量。
  • 选择一个操作系统配置文件,然后根据在操作系统配置文件中定义的操作系统用户的权限,创建并运行列配置文件、企业发现配置文件以及结果卡。
  • 使用存储库资产锁定可防止其他用户覆盖所做的工作。
  • 使用版本控制系统可保存配置文件的多个版本。
  • 创建标记并将其分配给数据对象。
  • 在 Business Glossary Desktop 中查找对象名称作为业务术语的含义。例如,可以查找列名或配置文件名称的含义,以了解其业务要求和当前的实现。
可以在 Developer tool 中执行以下任务:
  • 发现数据源中两个数据列之间的潜在联接度。
  • 确定一个或多个数据源内列中成对重叠数据的百分比。
  • 比较列剖析的结果。
  • 从配置文件中生成映射对象。
  • 发现数据源中的主键。
  • 发现一个或多个数据源中的外键。
  • 发现数据源中各列之间的功能相关性。
  • 对多个连接中的大量数据源运行数据发现任务。数据发现任务包括列配置文件、主键和外键关系推理、数据域发现以及生成数据关系的合并图形摘要。
可以在 Analyst 工具中执行以下任务:
  • 对多个连接中的大量数据源执行企业发现。可以查看列元数据和数据域的合并的发现结果摘要。
  • 执行发现搜索以查找数据和元数据在企业中存在的位置。您可以搜索特定资产,例如数据对象、规则和配置文件。发现搜索查找资产并识别与数据库和企业架构中的其他资产之间的关系。
  • 查看最新配置文件运行的配置文件结果。
  • 比较列配置文件中两次配置文件运行的配置文件结果。
  • 查看每个结果卡度量和度量组的结果卡沿袭。
  • 查看结果卡仪表板。
  • 向配置文件或配置文件中的列添加注释。
  • 为配置文件或配置文件中的列分配标记。
  • 为配置文件中的列分配业务术语。