目录

Search

  1. Data Discovery 简介
  2. 使用 Informatica Analyst 的 Data Discovery
  3. 使用 Informatica Developer 执行数据发现

Data Discovery 指南

Data Discovery 指南

数据域发现概念概览

数据域发现概念概览

您需要确定和了解关键源数据的含义,以便能够采取措施对其进行有效处理。数据域发现是根据数据的语义发现数据源中数据的功能含义的过程。
创建配置文件以执行数据域发现,您可以识别企业内的关键数据特性。然后可以为数据应用更多数据管理策略(如数据质量或数据屏蔽)。例如,发现产品代码或说明,以分析需要应用哪些数据质量标准以及解析规则,以使数据有用且可靠。另一个示例是查找敏感客户数据,如信用卡号、电子邮件 ID 和电话号码。可能要屏蔽这些信息以对其加以保护。
您可以创建并运行配置文件,以便在 Analyst 和 Developer tool 中执行数据域发现。可以定义配置文件,以根据以下规则执行数据域发现:
  • 数据规则。查找包含与规则中定义的特定逻辑相匹配的数据的列。
  • 列名称规则。查找与规则中定义的列名称逻辑相匹配的列。
可以从列配置文件结果中的值和模式创建数据域。然后可以使用这些数据域跨多个数据系统或在整个企业内发现关键数据。
您可以创建一个利用采样选项和筛选器来执行数据域发现的配置文件。运行该配置文件时,即会对数据源应用采用选项和筛选器,同时生成一个数据集。数据域发现过程会使用该数据集来发现数据域。