Índice

Search

  1. Introducción a la obtención de datos
  2. Obtención de datos con Informatica Analyst
  3. Obtención de datos con Informatica Developer
  4. Compatibilidad de función basada en la conexión del almacén de creación de perfiles

Guía de detección de datos

Guía de detección de datos

Crear un objeto de datos de archivo complejo desde un origen de datos Avro o Parquet

Crear un objeto de datos de archivo complejo desde un origen de datos Avro o Parquet

Puede crear un objeto de datos de archivo complejo desde un origen de datos Avro o Parquet con el tipo de acceso
Archivo
o
Conexión
. Puede crear un perfil de columna en el objeto de datos.
  1. En la vista
    Explorador de objetos
    , seleccione un proyecto.
  2. Haga clic en
    Archivo
    Nuevo
    Objeto de datos
    .
    A continuación, aparecerá el cuadro de diálogo
    Nuevo
    .
  3. Seleccione
    Objetos de datos físicos
    Objeto de datos de archivo complejo
    y haga clic en
    Siguiente
    .
    A continuación, aparecerá el cuadro de diálogo
    Nuevo objeto de datos de archivo complejo
    .
  4. Especifique un nombre para el objeto de datos.
  5. Puede elegir el tipo de acceso
    Conexión
    o
    Archivo
    .
    • Si selecciona el tipo de acceso
      Conexión
      , realice los siguientes pasos:
      1. Haga clic en
        Examinar
        para elegir una conexión de HDFS.
      2. En el cuadro de diálogo
        Elegir conexión
        , elija un origen de datos y haga clic en
        Aceptar
        .
      3. En el cuadro de diálogo
        Nuevo objeto de datos de archivo complejo
        , haga clic en
        Finalizar
        .
        El objeto de datos aparece en la carpeta del proyecto.
    • Si selecciona el tipo de acceso
      Archivo
      y el formato de recursos
      Binario
      , realice los siguientes pasos:
      1. Haga clic en
        Examinar
        para elegir un archivo Avro o Parquet en el equipo local.
      2. En el cuadro de diálogo
        Nuevo objeto de datos de archivo complejo
        , haga clic en
        Finalizar
        .
        El objeto de datos aparece en la carpeta del proyecto.
      3. Seleccione el objeto de datos en la carpeta del proyecto y haga clic en la vista
        Operaciones de objeto de datos
        .
      4. En la vista
        Operaciones de objeto de datos
        , haga clic en la ficha
        Lectura
        Avanzadas
        .
      5. En la ficha
        Avanzadas
        , introduzca la ruta de archivo del origen de datos del equipo Linux o Windows en el campo
        Ruta de archivo
        .
      6. Introduzca el formato de archivo como
        Entrada personalizada
        .
      7. Introduzca
        com.informatica.avro.AvroToXML
        en el campo
        Formato de entrada
        para orígenes de datos Avro, y
        com.informatica.parquet.ParquetToXML
        en el campo
        Formato de entrada
        para orígenes de datos Parquet. Cuando añade el formato de entrada, la transformación del procesador de datos procesa y transforma los orígenes de datos en formato Avro o Parquet en un origen de datos en formato XML en tiempo de ejecución.
    • Si selecciona el tipo de acceso
      Archivo
      y el formato de recursos
      Avro
      o
      Parquet
      , realice los siguientes pasos:
      1. Haga clic en
        Examinar
        para elegir un archivo Avro o Parquet en el equipo local.
      2. En el cuadro de diálogo
        Nuevo objeto de datos de archivo complejo
        , haga clic en
        Finalizar
        .
        El objeto de datos aparece en la carpeta del proyecto.
      3. Después de crear el objeto de datos, vaya a la ficha
        Operaciones de objeto de datos
        Lectura
        Avanzadas
        y compruebe si la ruta del archivo del campo
        Ruta de archivo
        coincide con el origen de datos del equipo Linux o Windows.
      El formato de recursos
      Avro
      o
      Parquet
      solo se puede elegir para orígenes de datos Avro y Parquet estructurados sin formato.
      Puede elegir una carpeta con varios archivos Avro o Parquet para crear un objeto de datos. Después de crear el objeto de datos, vaya a la ficha
      Operaciones de objeto de datos
      Lectura
      Avanzadas
      y compruebe si la ruta del archivo del campo
      Ruta de archivo
      coincide con la carpeta de los orígenes de datos del equipo Linux o Windows.