Crear un objeto de datos de archivo complejo desde un origen de datos Avro o Parquet
Crear un objeto de datos de archivo complejo desde un origen de datos Avro o Parquet
Puede crear un objeto de datos de archivo complejo desde un origen de datos Avro o Parquet con el tipo de acceso
Archivo
o
Conexión
. Puede crear un perfil de columna en el objeto de datos.
En la vista
Explorador de objetos
, seleccione un proyecto.
Haga clic en
Archivo
Nuevo
Objeto de datos
.
A continuación, aparecerá el cuadro de diálogo
Nuevo
.
Seleccione
Objetos de datos físicos
Objeto de datos de archivo complejo
y haga clic en
Siguiente
.
A continuación, aparecerá el cuadro de diálogo
Nuevo objeto de datos de archivo complejo
.
Especifique un nombre para el objeto de datos.
Puede elegir el tipo de acceso
Conexión
o
Archivo
.
Si selecciona el tipo de acceso
Conexión
, realice los siguientes pasos:
Haga clic en
Examinar
para elegir una conexión de HDFS.
En el cuadro de diálogo
Elegir conexión
, elija un origen de datos y haga clic en
Aceptar
.
En el cuadro de diálogo
Nuevo objeto de datos de archivo complejo
, haga clic en
Finalizar
.
El objeto de datos aparece en la carpeta del proyecto.
Si selecciona el tipo de acceso
Archivo
y el formato de recursos
Binario
, realice los siguientes pasos:
Haga clic en
Examinar
para elegir un archivo Avro o Parquet en el equipo local.
En el cuadro de diálogo
Nuevo objeto de datos de archivo complejo
, haga clic en
Finalizar
.
El objeto de datos aparece en la carpeta del proyecto.
Seleccione el objeto de datos en la carpeta del proyecto y haga clic en la vista
Operaciones de objeto de datos
.
En la vista
Operaciones de objeto de datos
, haga clic en la ficha
Lectura
Avanzadas
.
En la ficha
Avanzadas
, introduzca la ruta de archivo del origen de datos del equipo Linux o Windows en el campo
Ruta de archivo
.
Introduzca el formato de archivo como
Entrada personalizada
.
Introduzca
com.informatica.avro.AvroToXML
en el campo
Formato de entrada
para orígenes de datos Avro, y
com.informatica.parquet.ParquetToXML
en el campo
Formato de entrada
para orígenes de datos Parquet. Cuando añade el formato de entrada, la transformación del procesador de datos procesa y transforma los orígenes de datos en formato Avro o Parquet en un origen de datos en formato XML en tiempo de ejecución.
Si selecciona el tipo de acceso
Archivo
y el formato de recursos
Avro
o
Parquet
, realice los siguientes pasos:
Haga clic en
Examinar
para elegir un archivo Avro o Parquet en el equipo local.
En el cuadro de diálogo
Nuevo objeto de datos de archivo complejo
, haga clic en
Finalizar
.
El objeto de datos aparece en la carpeta del proyecto.
Después de crear el objeto de datos, vaya a la ficha
Operaciones de objeto de datos
Lectura
Avanzadas
y compruebe si la ruta del archivo del campo
Ruta de archivo
coincide con el origen de datos del equipo Linux o Windows.
El formato de recursos
Avro
o
Parquet
solo se puede elegir para orígenes de datos Avro y Parquet estructurados sin formato.
Puede elegir una carpeta con varios archivos Avro o Parquet para crear un objeto de datos. Después de crear el objeto de datos, vaya a la ficha
Operaciones de objeto de datos
Lectura
Avanzadas
y compruebe si la ruta del archivo del campo
Ruta de archivo
coincide con la carpeta de los orígenes de datos del equipo Linux o Windows.