Índice

Search

  1. Prólogo
  2. Introducción a la ingesta masiva
  3. Preparar
  4. Crear
  5. Implementar
  6. Run
  7. Supervisor
  8. Apéndice A: Referencia de comando infacmd mi

Guía de ingesta masiva

Guía de ingesta masiva

Conexiones

Conexiones

Cuando se ejecutan trabajos de ingesta masiva, los componentes de ingesta masiva utilizan las siguientes conexiones:
JDBC
Una conexión de JDBC tiene acceso a las tablas de la base de datos relacional del trabajo de ingesta masiva.
La conexión de origen que se usa en un trabajo de ingesta masiva debe ser una conexión de JDBC. Por ejemplo, para acceder a un esquema de Oracle, debe configurar una conexión de JDBC que use un controlador de Oracle para conectarse a una base de datos de Oracle. No se puede utilizar una conexión de Oracle.
Sqoop
Cuando se configura una conexión de JDBC con argumentos de Sqoop, las tareas se reparten entre JDBC y Sqoop. JDBC se utiliza para importar metadatos desde una base de datos relacional, mientras que Sqoop lee los datos.
Si utiliza una carga incremental para ingerir datos utilizando una conexión de Sqoop, el servicio de ingesta masiva hace uso del modo de importación incremental de Sqoop. Cuando el servicio de ingesta masiva configura el filtro de datos incrementales, el filtro se inserta en el origen de Sqoop.
Si utiliza una conexión de Sqoop, tenga en cuenta las siguientes limitaciones:
  • Una tabla de origen no se puede ingerir con una conexión de Sqoop si la tabla contiene caracteres especiales en los metadatos de tabla.
  • No se pueden ingerir tipos de datos Blob con una conexión de Sqoop.
Hadoop
Una conexión de Hadoop permite que el servicio de integración de datos inserte los trabajos de ingesta masiva en el entorno de Hadoop donde los trabajos se ejecutan en el motor de Spark.
Hive
Una conexión de Hive accede a los datos de Hive y permite que el trabajo de ingesta masiva escriba datos de Hive en un destino de Hive.
HDFS
Una conexión de HDFS accede a los datos en el clúster de Hadoop para permitir que un trabajo de ingesta masiva escriba datos de archivo sin formato en el clúster.
Para obtener más información sobre las propiedades de conexión, consulte el apéndice "Conexiones" en la guía
Informatica
Guía del usuario de Data Engineering Integration
.