El módulo de servicio de vista previa de datos administra las solicitudes procedentes de Developer tool para obtener una vista previa de los datos de origen o de transformación de una asignación.
Cuando se obtiene una vista previa de datos, Developer tool envía la solicitud correspondiente al servicio de integración de datos, que usa el módulo de servicio de vista previa de datos para determinar si el trabajo debe ejecutarse en el entorno nativo o no nativo, dependiendo del punto de vista previa. El punto de vista previa es el objeto de una asignación cuyos datos ha elegido visualizar.
Los trabajos de vista previa de datos se ejecutan en el servicio de integración de datos o en el motor de Spark. El motor de Spark ejecuta el trabajo en los siguientes casos:
Cuando el punto de vista previa o cualquier transformación de nivel superior contiene datos jerárquicos
Cuando el punto de vista previa o cualquier transformación de nivel superior es una transformación de Python
Cuando el punto de vista previa o cualquier transformación de nivel superior es una transformación de expresión configurada para ventanas
Cuando la asignación contiene una combinación de transformaciones que se debe ejecutar en el motor de Spark
Cuando el motor de Spark ejecuta un trabajo de vista previa de datos, el trabajo utiliza el servidor de trabajos de Spark o scripts spark-submit, dependiendo de la distribución del clúster que configure. Si la asignación se configura con una distribución que admite el servidor de trabajos de Spark, el módulo de servicio de vista previa de datos usará el servidor de trabajos de Spark para ejecutar los trabajos de vista previa en el motor de Spark. De lo contrario, el módulo de servicio de vista previa de datos usa un script spark-submit.
Para obtener más información sobre las distribuciones de clúster compatibles, consulte la
Guía del usuario de Data Engineering Integration
.
Cuando el servicio de integración de datos recibe una solicitud de vista previa que utiliza el servidor de trabajos de Spark, el módulo de servicio de vista previa de datos inicia el servidor de trabajos de Spark y pasa la asignación al LDTM. El LDTM genera un flujo de trabajo de Spark y el servidor de trabajos de Spark ejecuta el trabajo en el clúster de Hadoop. El trabajo de vista previa de datos transfiere el resultado temporalmente al directorio de transferencia temporal de HDFS configurado. El servicio de integración de datos pasa a Developer tool los datos transferidos temporalmente.