目录

Search

  1. Data Discovery 简介
  2. 使用 Informatica Analyst 的 Data Discovery
  3. 使用 Informatica Developer 执行数据发现

Data Discovery 指南

Data Discovery 指南

在 Informatica Analyst 中创建配置文件以执行数据域发现

在 Informatica Analyst 中创建配置文件以执行数据域发现

必须先至少创建一个数据域,才能创建一个配置文件以在 Analyst 工具中执行数据域发现。配置文件可以同时发现匹配预定义数据域的列名称和列数据。
  1. 发现
    工作区中,单击
    配置文件
    ,或从 Analyst 工具中的任意位置选择
    新建
    配置文件
    此时将显示
    新建配置文件
    向导。
  2. 默认情况下将选择
    单源
    选项。单击
    下一步
  3. 指定常规属性
    屏幕中,输入配置文件的名称和可选说明。 在“位置”字段中,选择要在其中创建配置文件的项目或文件夹。单击
    下一步
  4. 选择源
    屏幕中,单击
    选择
    以选择数据对象,或单击
    新建
    以导入数据对象。 单击
    下一步
  5. 指定设置
    屏幕中,选择运行列配置文件、数据域发现或启用数据域发现的列配置文件。 默认情况下将选择列配置文件选项。
    • 选择
      运行数据域发现
      可执行数据域发现。在
      数据域
      窗格中选择数据域选项。
    • 选择
      运行列配置文件
      运行数据域发现
      可运行启用数据域发现的列配置文件。在
      数据域
      窗格中选择数据域选项。
      默认情况下,选择用于列配置文件的列也适用于数据域发现。无论选择了哪些列用于列配置文件,您都可以单击
      编辑
      以选择或取消选择用于数据域发现的列。
    • 选择“数据”、“列”或“数据和列”以对其运行数据域发现。
    • 运行配置文件
      窗格中选择采样选项。
    • 向下钻取
      窗格中选择向下钻取选项。或者,单击
      选择列
      ,以选择要进行向下钻取的列。您可以选择跳过对数据类型或数据域已经过批准的列进行数据类型和数据域推理。
    • 选择遵从性条件,然后可以选择
      从数据域发现中排除空值
      选项。
    • 选择
      本地
      Hive
      Hadoop
      作为运行时环境。如果选择 Hive 或 Hadoop 选项,请单击
      选择
      以在
      选择 Hadoop 连接
      对话框中选择 Hadoop 连接。
  6. 指定规则和筛选器
    屏幕中,可以为配置文件添加、编辑或删除规则和筛选器。
  7. 单击
    保存并完成
    以创建配置文件,或单击
    保存并运行
    以创建并运行配置文件。