目录

Search

  1. Data Discovery 简介
  2. 使用 Informatica Analyst 的 Data Discovery
  3. 使用 Informatica Developer 执行数据发现

Data Discovery 指南

Data Discovery 指南

对半结构化数据源运行列配置文件

对半结构化数据源运行列配置文件

基于 Avro、JSON、Parquet 或 XML 数据源创建平面文件数据对象或复杂文件数据对象后,您可以基于该数据对象创建和运行列配置文件。
  1. 对象浏览器
    视图中,为 Avro、JSON、Parquet 或 XML 文件选择物理数据对象。
  2. 单击
    文件
    新建
    配置文件
    此时将显示
    新建
    对话框。
  3. 选择
    配置文件
    。单击
    下一步
    此时将显示
    新建配置文件
    对话框。
  4. 新建配置文件
    对话框中,为配置文件添加名称和可选说明。
  5. 选择
    处理扩展文件格式
    选项。单击
    下一步
    下图显示的是选择了
    处理扩展文件格式
    选项的
    新建配置文件
    向导:
    此图显示的是“新建配置文件”向导,您必须在其中选择“处理扩展文件格式(XML/JSON)”选项。
    1. 处理扩展文件格式。选择此选项可处理半结构化数据源。
    为“资源格式”选择
    Avro
    Parquet
    时,Avro 和 Parquet 数据源不会显示
    处理扩展文件格式
    选项。
  6. 单个数据对象配置文件
    页面中,根据需要选择
    列选择
    数据域发现
    下的列和选项。单击
    完成
    如果 Developer tool 安装在 Linux 计算机上,而且 JSON 或 XML 物理数据对象为含有文本文件的平面文件数据对象,请执行以下任务:
    1. 概览
      选项卡中,更新
      精度
      值,以便将字符数加入服务器中数据源的文件路径。
    2. 在平面文件数据对象上创建配置文件后,将数据源的文件路径更新为服务器中的相应位置。 要更新文件路径,请单击
      高级
      选项卡中的
      运行时: 读取
      源文件目录
      ,然后添加文件路径。
  7. 右键单击配置文件,然后选择
    运行配置文件
    此时将显示配置文件结果。