Utilice la conexión de Hadoop para configurar las asignaciones de manera que se ejecuten en un clúster de Hadoop. Una conexión de Hadoop es una conexión de tipo clúster. Puede crear y administrar una conexión de Hadoop en la Herramienta del administrador o en Developer tool. Puede utilizar infacmd para crear una conexión de Hadoop. Las propiedades de conexión de Hadoop distinguen mayúsculas de minúsculas a menos que se indique lo contrario.
Las propiedades en tiempo de ejecución del entorno de Hadoop se pueden configurar en el servicio de integración de datos, en la conexión de Hadoop y en la asignación. Puede reemplazar una propiedad configurada a un alto nivel estableciendo el valor en un nivel inferior. Por ejemplo, si configura una propiedad personalizada del servicio de integración de datos, podrá reemplazarla en la conexión de Hadoop o en la asignación. El servicio de integración de datos procesa las sustituciones de propiedades en función de las siguientes prioridades:
Asignación de propiedades personalizadas configurada mediante
infacmd ms runMapping
con la opción
-cp
Asignación de propiedades en tiempo de ejecución para el entorno de Hadoop
Propiedades avanzadas de la conexión de Hadoop para motores en tiempo de ejecución
Propiedades generales avanzadas, variables de entorno y classpaths de la conexión de Hadoop
Propiedades personalizadas del servicio de integración de datos
Cuando una asignación usa Hive Server 2 para ejecutar un trabajo o partes de un trabajo, no puede anular las propiedades que están configuradas en el nivel de clúster en consultas preSQL o post-SQL oni instrucciones de reemplazo de SQL.
Solución alternativa: En lugar de intentar usar la configuración del clúster en el dominio para anular las propiedades del clúster, pase la configuración de anulación a la URL de JDBC. Por ejemplo:
beeline -u "jdbc:hive2://<host de dominio>:<número de puerto>/tpch_text_100" --hiveconf hive.execution.engine=tez