目录

Search

  1. Data Discovery 简介
  2. 使用 Informatica Analyst 的 Data Discovery
  3. 使用 Informatica Developer 执行数据发现

Data Discovery 指南

Data Discovery 指南

在 Informatica Analyst 中创建列配置文件

在 Informatica Analyst 中创建列配置文件

既可创建自定义配置文件,也可创建默认配置文件。创建自定义配置文件时,您可以配置列、采样行和向下钻取选项。创建默认配置文件时,将对整个数据集的所有数据域运行列配置文件和数据域发现。
  1. 发现
    工作区中,单击
    配置文件
    ,或从表头区域中选择
    新建
    配置文件
    您可以右键单击
    工作区中的数据对象并创建配置文件。在此配置文件中,配置文件名称、位置名称和数据对象将从数据对象属性中提取。可以创建默认配置文件,也可以通过自定义相关设置来创建自定义配置文件。
    将显示
    新建配置文件
    向导。
  2. 默认情况下,
    单源
    选项处于选中状态。单击
    下一步
  3. 指定常规属性
    屏幕中,输入配置文件的名称和可选说明。在“位置”字段中,选择要在其中创建配置文件的项目或文件夹。单击
    下一步
  4. 选择源
    屏幕中,单击
    选择
    以选择数据对象,或单击
    新建
    以导入数据对象。单击
    下一步
    • 选择数据对象
      对话框中,选择一个数据对象。单击
      确定
      “属性”窗格将显示所选数据对象的属性。“数据预览”窗格将显示数据对象中的列。
    • 新建数据对象
      对话框中,可以选择要为其创建配置文件的连接、架构、表或视图,选择位置,然后创建用于导入数据对象的文件夹。单击
      确定
  5. 选择源
    屏幕中,选择要运行配置文件的列。或者,选择
    名称
    以选择所有列。单击
    下一步
    默认情况下将选择所有列。Analyst 工具将显示每个列的列属性,例如,名称、数据类型、精度、小数位数、可空性和主键的参与方。
  6. 指定设置
    屏幕中,选择要运行列配置文件还是数据域发现或同时运行列配置文件和数据域发现。默认情况下将选择列配置文件选项。
    • 选择
      运行列配置文件
      以运行列配置文件。
    • 选择
      运行数据域发现
      以执行数据域发现。在
      数据域
      窗格中,选择要发现的数据域,选择遵从条件,然后在
      编辑数据域发现的列选择
      对话框中选择用于数据域发现的列。
    • 选择
      运行列配置文件
      运行数据域发现
      以运行列配置文件和数据域发现。在
      数据域
      窗格中选择数据域选项。
      默认情况下,所选列将用于列配置文件和数据域发现。单击
      编辑
      可选择或取消选择用于数据域发现的列。
    • 选择“数据”、“列”或“数据和列”以对其运行数据域发现。
    • 选择采样选项。您可以在下列窗格中选择
      所有行(完整分析)
      先采样
      随机采样
      随机采样(自动)
      作为采样选项:
      针对以下对象运行配置文件
      。此选项将应用于列配置文件和数据域发现。
    • 选择向下钻取选项。您可以在下列窗格中选择
      实时
      暂存
      向下钻取选项,或选择
      关闭
      以禁用向下钻取:
      向下钻取
      。或者,单击
      选择列
      以选择要向下钻取的列。可以选择跳过对数据类型或数据域已经过批准的列进行数据类型和数据域推理。
    • 选择
      本地
      运行时环境选项。
      无法在 Hadoop 运行时环境中的 Hive 引擎或 Blaze 引擎上运行配置文件,因为 Hadoop 环境在当前 Informatica 版本中不受支持。
  7. 单击
    下一步
    将打开
    指定规则和筛选器
    屏幕。
  8. 指定规则和筛选器
    屏幕中,您可以执行以下任务:
    • 创建、编辑或删除规则。您可以将现有规则应用到配置文件。
    • 创建、编辑或删除筛选器。
      基于此配置文件创建结果卡时,可以重用为配置文件创建的筛选器。
  9. 单击
    保存并完成
    以创建配置文件,或单击
    保存并运行
    以创建并运行配置文件。