Utilice un motor Blaze o Spark para ejecutar las asignaciones de Hadoop en un flujo de trabajo.
El servicio de integración de datos genera el script del motor Blaze o Spark en función de la lógica de asignación, un identificador único para el script y las tareas de las cuales depende el script.
Puede seleccionar el motor de ejecución al nivel de plan. Si selecciona el motor de ejecución Blaze, el proceso es más rápido porque Blaze utiliza un compilador de flujo de trabajo interno para ejecutar la asignación. Utilice un motor Blaze para mejorar la velocidad y el rendimiento de la tarea.
Si no utiliza la autenticación Kerberos, puede utilizar un motor Blaze para destinos de archivos complejos. En el enmascaramiento local de Hive, puede utilizar el motor de ejecución de Spark.
Si utiliza un motor Blaze, puede utilizar las siguientes transformaciones en una regla de mapplet:
Expresión
Enmascaramiento de datos
Conversión de mayúsculas y minúsculas
Comparación
Decisión
Etiquetador
Fusión
Analizador
Media ponderada
Estandarizador
Java pasiva
Si utiliza un motor Spark, puede utilizar las siguientes transformaciones en una regla de mapplet:
Expresión
Enmascaramiento de datos
Java pasiva
No se puede utilizar un motor Blaze para las siguientes opciones:
Diccionarios ODBC y orígenes ODBC
Destino de archivo complejo si se utiliza la autenticación Kerberos
Truncar tabla de destino
El origen es Hive y el destino es HDFS
Enmascaramiento local de Hive
El motor Spark tiene las siguientes limitaciones:
Para usar un motor Spark cuando los orígenes son bases de datos relacionales, como Oracle, Sybase, Microsoft SQL Server, y DB2 for Linux, UNIX y Windows, debe usar el tipo de conexión JDBC para crear la conexión. No puede usar los otros tipos de conexiones.
Con un motor Spark, no se pueden realizar el enmascaramiento de ofuscación ni el de sustitución.
Con el motor Spark, no se pueden realizar operaciones de enmascaramiento de datos en el tipo de datos binarios de Hive.