Creación de perfiles y opciones de muestreo en el motor Spark
Creación de perfiles y opciones de muestreo en el motor Spark
A partir de la versión 10.4.0, puede ejecutar perfiles y seleccionar opciones de muestreo en el motor de Spark.
Creación de perfiles en el motor Spark
Puede crear y ejecutar perfiles en el motor Spark en las herramientas Informatica Developer e Informatica Analyst. Puede realizar la detección de dominios de datos y la creación de cuadros de mandos en el motor Spark.
Opciones de muestreo en el motor Spark
Puede seleccionar las siguientes opciones de muestreo para ejecutar perfiles en el motor de Spark:
La opción de muestreo
Limit n
ejecuta un perfil basado en el número de filas en el objeto de datos. Cuando decide ejecutar un perfil en el entorno Hadoop, el motor Spark recopila muestras de varias particiones del objeto de datos y las envía a un único nodo para calcular el tamaño de la muestra. No puede aplicar las opciones de muestreo Limit n en los perfiles con un filtro avanzado.
Se admite en la base de datos de Oracle a través de la conexión de Sqoop.
La opción de muestreo
Random percentage
ejecuta un perfil en un porcentaje de las filas del objeto de datos.
Para obtener información sobre los perfiles y las opciones de muestreo en el motor Spark, consulte la