Índice

Search

  1. Prólogo
  2. Introducción a la ingesta masiva
  3. Preparar
  4. Crear
  5. Implementar
  6. Run
  7. Supervisor
  8. Apéndice A: Referencia de comando infacmd mi

Guía de ingesta masiva

Guía de ingesta masiva

Definición

Definición

La definición describe el tipo de especificación de ingesta masiva que desea crear.
En la definición hay que especificar un nombre y una descripción y seleccionar el escenario de la especificación. El escenario determina si la especificación ingiere datos desde una base de datos relacional en un destino de Hive o en un destino de HDFS. El escenario que se especifique define las propiedades que se pueden configurar en el resto de la especificación.
También se puede habilitar la carga incremental. Si habilita la carga incremental, puede ingerir datos incrementales cuando ejecute la especificación. Después de habilitar la carga incremental, deberá configurar las opciones de carga incremental cuando configure el origen relacional y el destino de Hive o de HDFS.
La siguiente imagen muestra la página Definición de la especificación de ingesta masiva:
Esta captura de pantalla muestra la página Definición de la especificación de ingesta masiva. En la página Definición se pueden configurar las siguientes propiedades: Nombre, Descripción y Escenario. En la esquina superior derecha, tiene la opción Siguiente para ir a la página siguiente o el botón X para descartar la especificación.
En la siguiente tabla se describen las propiedades que se pueden configurar en la definición:
Propiedad
Descripción
Nombre
Obligatorio. Nombre de la especificación de ingesta masiva. La distinción entre mayúsculas y minúsculas no se aplica a este nombre, que además debe ser único.
Este nombre no se puede editar después de crear la especificación de ingesta masiva.
Descripción
Opcional. Descripción de la especificación.
Escenario de ingesta
Obligatorio. Escenario donde tiene lugar la ingesta de datos. Se pueden ingerir datos desde una base de datos relacional en un destino de Hive o en un destino de HDFS.
El escenario de ingesta no se puede editar después de crear la especificación de ingesta masiva.
Habilitar carga incremental
Opcional. Permite ingerir datos utilizando una carga incremental cuando la especificación ejecuta.