Informatica Data Quality
- Informatica Data Quality 10.4.1
- Todos los productos
Propiedad
| Descripción
|
---|---|
Nombre de usuario de suplantación
| Obligatorio si el clúster Hadoop utiliza la autenticación Kerberos. Usuario de suplantación de Hadoop. El nombre de usuario que suplanta el servicio de integración de datos para ejecutar asignaciones en el entorno Hadoop.
El servicio de integración de datos ejecuta asignaciones basadas en el usuario configurado. El servicio de integración de datos ejecuta asignaciones con usuarios de acuerdo con la siguiente prioridad:
|
Códec de compresión de tabla temporal
| Biblioteca de compresión de Hadoop para el nombre de clase de un códec de compresión.
El motor de Spark no admite ajustes de compresión para tablas temporales. Cuando se ejecutan asignaciones en el motor de Spark, este almacena las tablas temporales en un formato de archivo sin comprimir.
|
Nombre de clase de códec
| Nombre de clase de códec que habilita la compresión de datos y mejora el rendimiento en tablas de ensayo temporales.
|
Nombre de la base de datos de transferencia provisional de Hive
| Espacio de nombres para tablas de ensayo de Hive. Utilice el nombre predeterminado para tablas que no tienen un nombre de base de datos especificado.
Si no configura un espacio de nombres, el servicio de integración de datos utiliza el nombre de base de datos de Hive en la conexión de destino de Hive para crear tablas de transferencia provisional.
Cuando ejecute una asignación en el entorno nativo para escribir datos en Hive, debe configurar el nombre de la base de datos de transferencia provisional de Hive en la conexión de Hive. El servicio de integración de datos omite el valor que configura en la conexión de Hadoop.
|
SQL de entorno
| Los comandos SQL para establecer el entorno de Hadoop. El servicio de integración de datos ejecuta el SQL del entorno al principio de cada script de Hive generado por un trabajo de HiveServer2.
El uso de comandos SQL de entorno se rige por las siguientes reglas y directrices:
|
Tipo de motor
| El servicio de integración de datos utiliza HiveServer2 para procesar fragmentos de algunos trabajos mediante la ejecución de tareas de HiveServer2 en el motor de Spark. Cuando importa la configuración del clúster a través de la herramienta de administración, puede elegir crear conexiones. La propiedad de tipo de motor se rellena de forma predeterminada en función de la distribución.
Cuando crea una conexión manualmente, debe configurar el tipo de motor. Utilice el siguiente tipo de motor, en función de la distribución de Hadoop:
|
Propiedades avanzadas
| Lista de propiedades avanzadas que son exclusivas del entorno Hadoop. Las propiedades son comunes para los motores de Blaze y Spark. Las propiedades avanzadas incluyen una lista de propiedades predeterminadas.
Las propiedades en tiempo de ejecución del entorno de Hadoop se pueden configurar en el servicio de integración de datos, en la conexión de Hadoop y en la asignación. Puede reemplazar una propiedad configurada a un alto nivel estableciendo el valor en un nivel inferior. Por ejemplo, si configura una propiedad personalizada del servicio de integración de datos, podrá reemplazarla en la conexión de Hadoop o en la asignación. El servicio de integración de datos procesa las sustituciones de propiedades en función de las siguientes prioridades:
Informatica no recomienda cambiar estos valores de propiedad sin consultar antes la documentación de terceros, la documentación de Informatica o con el servicio de atención al cliente global de Informatica. Si cambia un valor sin conocimiento de la propiedad, es posible que experimente degradación del rendimiento u otros resultados inesperados.
|