Índice

Search

  1. Prólogo
  2. Introducción a la ingesta masiva
  3. Preparar
  4. Crear
  5. Implementar
  6. Run
  7. Supervisor
  8. Apéndice A: Referencia de comando infacmd mi

Guía de ingesta masiva

Guía de ingesta masiva

Modos incrementales

Modos incrementales

Si habilita la carga incremental en una especificación de ingesta masiva, debe seleccionar un modo de ingerir los datos.
Puede seleccionar el modo de anexión o el modo de sobrescritura. El modo de anexión anexa los datos incrementales a los datos en el destino. El modo de sobrescritura sobrescribe los datos en el destino por los datos incrementales. El modo de sobrescritura se puede usar si el destino es un área de almacenamiento provisional, y no el almacén de datos operativo final.
Por ejemplo, el destino puede contener los siguientes datos de una ejecución previa de la especificación:
EmpID
EmpLastName
481530
'Basquez'
481531
'Savage'
481532
'Greene'
En la siguiente tabla se muestran los datos incrementales que el motor de Spark ingiere en la ejecución actual de la especificación:
EmpID
EmpLastName
481533
'Caldwell'
481534
'Galloway'
Si utiliza el modo de anexión, los datos incrementales se anexan al destino. Cuando el trabajo de ingesta se complete, el destino contendrá los siguientes datos:
EmpID
EmpLastName
481530
'Basquez'
481531
'Savage'
481532
'Greene'
481533
'Caldwell'
481534
'Galloway'
Si utiliza el modo de sobrescritura, los datos incrementales sobrescriben el destino. Cuando el trabajo de ingesta se complete, el destino contendrá los siguientes datos:
EmpID
EmpLastName
481533
'Caldwell'
481534
'Galloway'