Informatica Data Quality
- Informatica Data Quality 10.5.6
- Todos los productos
Opción
| Descripción
|
---|---|
Habilitar creación de perfiles de columna
| Ejecuta un perfil de columna como parte de la detección empresarial.
|
Excluye los tipos de datos y los dominios de datos aprobados de la deducción de tipo de datos y del dominio de datos en las siguientes ejecuciones del perfil.
| Excluye el tipo de datos o el dominio de datos aprobado de la deducción de tipo de datos y del dominio de datos de la siguiente ejecución del perfil.
|
Opción
| Descripción
|
---|---|
Native
| La Herramienta del analista envía los trabajos de perfil al módulo del servicio de creación de perfiles. A continuación, el módulo del servicio de creación de perfiles divide los trabajos de perfil en un conjunto de asignaciones. El servicio de integración de datos ejecuta estas asignaciones y escribe los resultados de perfil en el almacén de creación de perfiles.
|
Blaze
| El servicio de integración de datos inserta la lógica de perfil en el motor de Blaze en el clúster de Hadoop para ejecutar los perfiles.
|
Spark
| El servicio de integración de datos inserta la lógica de perfil en el motor de Spark en el clúster de Hadoop para ejecutar perfiles.
|
Opción
| Descripción
|
---|---|
Todas las filas
| Ejecuta un perfil de columna en todas las filas del origen de datos.
Se admite en el entorno en tiempo de ejecución nativo, de Blaze y de Spark.
|
Primeras <número> filas
| Ejecuta un perfil en las filas de muestra desde el principio de las filas en el objeto de datos. Puede especificar un máximo de 2.147.483.647 filas.
Se admite en el entorno en tiempo de ejecución nativo y de Blaze.
|
Limitar N <número> filas
| Ejecuta un perfil en función del número de filas en el objeto de datos. Cuando se decide ejecutar un perfil en el entorno de validación de Hadoop, el motor de Spark recopila muestras de varias particiones del objeto de datos y las inserta en un único nodo para calcular el tamaño de la muestra. La opción de muestreo Limitar N admite bases de datos de Oracle, de SQL Server y de DB2. No se pueden aplicar filtros avanzados con la opción de muestreo Limitar N. Se puede seleccionar un máximo de 2 147 483 647 filas.
Se admite en el entorno en tiempo de ejecución de Spark.
|
Porcentaje aleatorio
| Ejecuta un perfil en un porcentaje de filas en el objeto de datos.
Se admite en el entorno en tiempo de ejecución de Spark.
|