Índice

Search

  1. Prólogo
  2. Informatica Developer
  3. El repositorio de modelos
  4. Búsquedas en Informatica Developer
  5. Conexiones
  6. Objetos de datos físicos
  7. Objetos de datos de archivo sin formato
  8. Vista lógica de datos
  9. Cómo visualizar datos
  10. Implementación de aplicaciones
  11. Implementación de revisiones de la aplicación
  12. Implementación de revisiones de la aplicación Ejemplo
  13. Integración continua y entrega continua (CI/CD)
  14. Importación y exportación de objetos
  15. Apéndice A: Referencia de tipos de datos
  16. Apéndice B: Accesos directos del teclado
  17. Apéndice C: Propiedades de conexión

Guía de Developer Tool

Guía de Developer Tool

Propiedades comunes

Propiedades comunes

En la tabla siguiente se describen las propiedades de conexión comunes que se configuran para la conexión de Hadoop:
Propiedad
Descripción
Nombre de usuario de suplantación
Obligatorio si el clúster Hadoop utiliza la autenticación Kerberos. Usuario de suplantación de Hadoop. El nombre de usuario que suplanta el servicio de integración de datos para ejecutar asignaciones en el entorno Hadoop.
El servicio de integración de datos ejecuta asignaciones basadas en el usuario configurado. El servicio de integración de datos ejecuta asignaciones con usuarios de acuerdo con la siguiente prioridad:
  1. Usuario del perfil del sistema operativo. La asignación se ejecuta con el usuario del perfil del sistema operativo si el usuario del perfil está configurado. Si no hay un usuario del perfil del sistema operativo, la asignación se ejecuta con el usuario de suplantación de Hadoop.
  2. Usuario de suplantación de Hadoop. La asignación se ejecuta con el usuario de suplantación de Hadoop si el usuario del perfil del sistema operativo no está configurado. Si el usuario de suplantación de Hadoop no está configurado, el servicio de integración de datos ejecuta las asignaciones con el usuario del servicio de integración de datos.
  3. Usuario de servicios de Informatica. La asignación se ejecuta con el usuario operativo que inicia el daemon de Informatica si el usuario del perfil del sistema operativo y el usuario de suplantación de Hadoop no están configurados.
Códec de compresión de tabla temporal
Biblioteca de compresión de Hadoop para el nombre de clase de un códec de compresión.
El motor de Spark no admite ajustes de compresión para tablas temporales. Cuando se ejecutan asignaciones en el motor de Spark, este almacena las tablas temporales en un formato de archivo sin comprimir.
Nombre de clase de códec
Nombre de clase de códec que habilita la compresión de datos y mejora el rendimiento en tablas de ensayo temporales.
Nombre de la base de datos de transferencia provisional de Hive
Espacio de nombres para tablas de ensayo de Hive. Utilice el nombre
predeterminado
para tablas que no tienen un nombre de base de datos especificado.
Si no configura un espacio de nombres, el servicio de integración de datos utiliza el nombre de base de datos de Hive en la conexión de destino de Hive para crear tablas de transferencia provisional.
Cuando ejecute una asignación en el entorno nativo para escribir datos en Hive, debe configurar el nombre de la base de datos de transferencia provisional de Hive en la conexión de Hive. El servicio de integración de datos omite el valor que configura en la conexión de Hadoop.
SQL de entorno
Los comandos SQL para establecer el entorno de Hadoop. El servicio de integración de datos ejecuta el SQL del entorno al principio de cada script de Hive generado por un trabajo de HiveServer2.
El uso de comandos SQL de entorno se rige por las siguientes reglas y directrices:
  • También puede usar el SQL de entorno para definir los parámetros de Hadoop o Hive que desea utilizar en los comandos PreSQL o en las consultas personalizadas.
  • Si utiliza varios valores en la propiedad SQL del entorno, procure que no haya espacios entre dichos valores.
Tipo de motor
El servicio de integración de datos utiliza HiveServer2 para procesar fragmentos de algunos trabajos mediante la ejecución de tareas de HiveServer2 en el motor de Spark. Cuando importa la configuración del clúster a través de la herramienta de administración, puede elegir crear conexiones. La propiedad de tipo de motor se rellena de forma predeterminada en función de la distribución.
Cuando crea una conexión manualmente, debe configurar el tipo de motor. Utilice el siguiente tipo de motor, en función de la distribución de Hadoop:
  • Amazon EMR: Tez
  • Azure HDI: Tez
  • Cloudera CDH: MRv2
  • Cloudera CDP: Tez
  • Hortonworks HDP: Tez
  • Mapr: MRv2
Propiedades avanzadas
Lista de propiedades avanzadas que son exclusivas del entorno Hadoop. Las propiedades son comunes para los motores de Blaze y Spark. Las propiedades avanzadas incluyen una lista de propiedades predeterminadas.
Las propiedades en tiempo de ejecución del entorno de Hadoop se pueden configurar en el servicio de integración de datos, en la conexión de Hadoop y en la asignación. Puede reemplazar una propiedad configurada a un alto nivel estableciendo el valor en un nivel inferior. Por ejemplo, si configura una propiedad personalizada del servicio de integración de datos, podrá reemplazarla en la conexión de Hadoop o en la asignación. El servicio de integración de datos procesa las sustituciones de propiedades en función de las siguientes prioridades:
  1. Asignación de propiedades personalizadas configurada mediante
    infacmd ms runMapping
    con la opción
    -cp
  2. Asignación de propiedades en tiempo de ejecución para el entorno de Hadoop
  3. Propiedades avanzadas de la conexión de Hadoop para motores en tiempo de ejecución
  4. Propiedades generales avanzadas, variables de entorno y classpaths de la conexión de Hadoop
  5. Propiedades personalizadas del servicio de integración de datos
Informatica no recomienda cambiar estos valores de propiedad sin consultar antes la documentación de terceros, la documentación de Informatica o con el servicio de atención al cliente global de Informatica. Si cambia un valor sin conocimiento de la propiedad, es posible que experimente degradación del rendimiento u otros resultados inesperados.