Índice

Search

  1. Prólogo
  2. Introducción a la ingesta masiva
  3. Preparar
  4. Crear
  5. Implementar
  6. Run
  7. Supervisor
  8. Apéndice A: Referencia de comando infacmd mi

Guía de ingesta masiva

Guía de ingesta masiva

Destino de HDFS

Destino de HDFS

Configure un destino de HDFS para ingerir datos de origen en un archivo sin formato en HDFS.
Cuando la especificación de ingesta masiva se configura para ingerir datos en un destino de HDFS, hay que configurar una conexión de HDFS y un directorio de ingesta para definir el destino.
Si habilita una carga incremental en la definición de la especificación de ingesta masiva, debe configurar las opciones de carga incremental para que el destino de HDFS seleccione un modo de ingerir los datos.
En la siguiente imagen se muestra la página Destino de un destino de HDFS:
Esta captura de pantalla muestra la página Destino de un destino de HDFS de la especificación de ingesta masiva. En la página Destino puede configurar propiedades para definir el destino de HDFS. La parte inferior de la página muestra una sección de opciones de carga incremental. En la esquina superior derecha, tiene la opción Siguiente para ir a la página siguiente o el botón X para descartar la especificación.
En la siguiente tabla se describen las propiedades que se pueden configurar para definir el destino de HDFS:
Propiedad
Descripción
Conexión de destino
Obligatorio. Conexión de HDFS utilizada para hallar el destino de almacenamiento de HDFS.
Si se realizan cambios en las conexiones HDFS disponibles, actualice el navegador o cierre sesión y vuelva a iniciarla en la herramienta de ingesta masiva.
Prefijo de tabla de destino
Prefijo añadido a los nombres de los archivos de destino.
Introduzca una cadena. Puede introducir caracteres alfanuméricos y de subrayado. El prefijo no distingue mayúsculas de minúsculas.
Sufijo de tabla de destino
Sufijo añadido a los nombres de los archivos de destino.
Introduzca una cadena. Puede introducir caracteres alfanuméricos y de subrayado. El prefijo no distingue mayúsculas de minúsculas.
Directorio de ingesta
Obligatorio. Directorio de destino en HDFS. Por cada origen que se ingiere, se crea un subdirectorio en el directorio de ingesta.
Si el directorio especificado ya existe, se reemplazará.
Por ejemplo, puede especificar
/temp
. Una tabla de origen con el nombre
PRODUCT
se ingerirá en el directorio
/temp/PRODUCT/
.
Compresión
Obligatorio. Formato de archivo comprimido que almacena los archivos de destino. Puede seleccionar Ninguno, Gzip, Bzip2, LZO, Snappy o Personalizado. Si elige Personalizado, introduzca el códec de compresión. El valor predeterminado es ninguno.
Códec de compresión
Si selecciona una compresión personalizada, introduzca el nombre de clase completo que implementa la interfaz CompressionCodec de Hadoop.
Delimitadores
Delimitadores utilizados para separar datos en los archivos de destino. Puede seleccionar coma, punto y coma, espacio, tabulación u otro cualquiera. Si selecciona Otro, puede definir un delimitador personalizado.
Otro delimitador
Obligatorio si elige
Otro
como delimitador. Introduzca un delimitador personalizado.
Modo
Obligatorio si habilita la carga incremental. Seleccione Anexar o Sobrescribir. El modo de anexión anexa los datos incrementales al destino. El modo de sobrescritura sobrescribe los datos en el destino por los datos incrementales. El valor predeterminado es Anexar.
Cuando el servicio de integración de datos almacena archivos temporales que se ingieren en un destino de HDFS, anexa un ID único al nombre de archivo original. El nombre de archivo resultante puede tener una longitud máxima de 255 caracteres.