Search

Guía de Developer Tool

Guía de Developer Tool

10.4.1
- 10.5.2
- 10.5.1

Anterior Siguiente

Propiedades comunes

Propiedades comunes

En la tabla siguiente se describen las propiedades de conexión comunes que se configuran para la conexión de Hadoop:

Propiedad	Descripción
Nombre de usuario de suplantación	Obligatorio si el clúster Hadoop utiliza la autenticación Kerberos. Usuario de suplantación de Hadoop. El nombre de usuario que suplanta el servicio de integración de datos para ejecutar asignaciones en el entorno Hadoop. El servicio de integración de datos ejecuta asignaciones basadas en el usuario configurado. El servicio de integración de datos ejecuta asignaciones con usuarios de acuerdo con la siguiente prioridad: Usuario del perfil del sistema operativo. La asignación se ejecuta con el usuario del perfil del sistema operativo si el usuario del perfil está configurado. Si no hay un usuario del perfil del sistema operativo, la asignación se ejecuta con el usuario de suplantación de Hadoop. Usuario de suplantación de Hadoop. La asignación se ejecuta con el usuario de suplantación de Hadoop si el usuario del perfil del sistema operativo no está configurado. Si el usuario de suplantación de Hadoop no está configurado, el servicio de integración de datos ejecuta las asignaciones con el usuario del servicio de integración de datos. Usuario de servicios de Informatica. La asignación se ejecuta con el usuario operativo que inicia el daemon de Informatica si el usuario del perfil del sistema operativo y el usuario de suplantación de Hadoop no están configurados.
Códec de compresión de tabla temporal	Biblioteca de compresión de Hadoop para el nombre de clase de un códec de compresión. El motor de Spark no admite ajustes de compresión para tablas temporales. Cuando se ejecutan asignaciones en el motor de Spark, este almacena las tablas temporales en un formato de archivo sin comprimir.
Nombre de clase de códec	Nombre de clase de códec que habilita la compresión de datos y mejora el rendimiento en tablas de ensayo temporales.
Nombre de la base de datos de transferencia provisional de Hive	Espacio de nombres para tablas de ensayo de Hive. Utilice el nombre predeterminado para tablas que no tienen un nombre de base de datos especificado. Si no configura un espacio de nombres, el servicio de integración de datos utiliza el nombre de base de datos de Hive en la conexión de destino de Hive para crear tablas de transferencia provisional. Cuando ejecute una asignación en el entorno nativo para escribir datos en Hive, debe configurar el nombre de la base de datos de transferencia provisional de Hive en la conexión de Hive. El servicio de integración de datos omite el valor que configura en la conexión de Hadoop.
SQL de entorno	Los comandos SQL para establecer el entorno de Hadoop. El servicio de integración de datos ejecuta el SQL del entorno al principio de cada script de Hive generado por un trabajo de HiveServer2. El uso de comandos SQL de entorno se rige por las siguientes reglas y directrices: También puede usar el SQL de entorno para definir los parámetros de Hadoop o Hive que desea utilizar en los comandos PreSQL o en las consultas personalizadas. Si utiliza varios valores en la propiedad SQL del entorno, procure que no haya espacios entre dichos valores.
Tipo de motor	El servicio de integración de datos utiliza HiveServer2 para procesar fragmentos de algunos trabajos mediante la ejecución de tareas de HiveServer2 en el motor de Spark. Cuando importa la configuración del clúster a través de la herramienta de administración, puede elegir crear conexiones. La propiedad de tipo de motor se rellena de forma predeterminada en función de la distribución. Cuando crea una conexión manualmente, debe configurar el tipo de motor. Utilice el siguiente tipo de motor, en función de la distribución de Hadoop: Amazon EMR: Tez Azure HDI: Tez Cloudera CDH: MRv2 Cloudera CDP: Tez Hortonworks HDP: Tez Mapr: MRv2
Propiedades avanzadas	Lista de propiedades avanzadas que son exclusivas del entorno Hadoop. Las propiedades son comunes para los motores de Blaze y Spark. Las propiedades avanzadas incluyen una lista de propiedades predeterminadas. Las propiedades en tiempo de ejecución del entorno de Hadoop se pueden configurar en el servicio de integración de datos, en la conexión de Hadoop y en la asignación. Puede reemplazar una propiedad configurada a un alto nivel estableciendo el valor en un nivel inferior. Por ejemplo, si configura una propiedad personalizada del servicio de integración de datos, podrá reemplazarla en la conexión de Hadoop o en la asignación. El servicio de integración de datos procesa las sustituciones de propiedades en función de las siguientes prioridades: Asignación de propiedades personalizadas configurada mediante infacmd ms runMapping con la opción -cp Asignación de propiedades en tiempo de ejecución para el entorno de Hadoop Propiedades avanzadas de la conexión de Hadoop para motores en tiempo de ejecución Propiedades generales avanzadas, variables de entorno y classpaths de la conexión de Hadoop Propiedades personalizadas del servicio de integración de datos Informatica no recomienda cambiar estos valores de propiedad sin consultar antes la documentación de terceros, la documentación de Informatica o con el servicio de atención al cliente global de Informatica. Si cambia un valor sin conocimiento de la propiedad, es posible que experimente degradación del rendimiento u otros resultados inesperados.

Propiedades de conexión de Hadoop

Descargar guía

Enviar comentarios