Índice

Search

  1. Prólogo
  2. Introducción a la ingesta masiva
  3. Preparar
  4. Crear
  5. Implementar
  6. Run
  7. Supervisor
  8. Apéndice A: Referencia de comando infacmd mi

Guía de ingesta masiva

Guía de ingesta masiva

Opciones de Hive

Opciones de Hive

Cuando se configura un reemplazo de transformación para un destino de Hive, se pueden configurar más parámetros para especificar la forma en que los datos se cargan en las tablas de destino de Hive.
En la siguiente imagen se muestra el cuadro de diálogo que aparece cuando se editan las propiedades de la tabla de destino de Hive:
En esta imagen se muestra un cuadro de diálogo para configurar opciones de Hive. Opciones de Hive está seleccionado.
En la siguiente tabla se describen las propiedades de la tabla de destino de Hive:
Propiedad
Descripción
Opciones de Hive
Seleccione esta opción para configurar la ubicación de destino de Hive.
Consulta DDL
Seleccione esta opción para configurar una consulta DDL personalizada que defina el modo en que los datos de las tablas de origen se cargan en las tablas de destino.
Formato de almacenamiento
Obligatorio. Formato de almacenamiento de las tablas de destino. Puede seleccionar Texto, Avro, Parquet u ORC. El valor predeterminado es Texto.
Ubicación externa
Ubicación externa del destino de Hive. Introduzca una ubicación externa para especificar una ubicación distinta al almacén depósito de Hive predeterminado.
Por cada origen que se ingiere se crea un subdirectorio en la ubicación externa especificada. Por ejemplo, puede especificar
/temp
. Una tabla de origen con el nombre
PRODUCT
se ingerirá en la ubicación externa
/temp/PRODUCT/
.
Clave de partición
Clave de partición de la tabla de Hive de destino.
Agrupado por
Clave de clúster de la tabla de Hive de destino.
Número de cubos
Obligatorio si se especifica una clave de clúster. Número de cubos entre el que se va a dividir la tabla de Hive de destino.
En la siguiente imagen se muestra el cuadro de diálogo que aparece cuando se edita la consulta DDL en las propiedades de la tabla de destino de Hive:
En esta imagen se muestra un cuadro de diálogo para configurar opciones de Hive. Consulta DDL está seleccionado.
Para editar la consulta DDL, utilice instrucciones SQL y los siguientes marcadores de posición:
INFA_TABLE_NAME
Obtiene el nombre de la tabla de destino en tiempo de ejecución.
INFA_COLUMN_LIST
Obtiene una lista de columnas de la tabla de destino en tiempo de ejecución.