Índice

Search

  1. Prólogo
  2. Parte 1: Introducción a la obtención de datos
  3. Parte 2: Obtención de datos con Informatica Analyst
  4. Parte 3: Obtención de datos con Informatica Developer
  5. Apéndice A: Compatibilidad de función basada en la conexión del almacén de creación de perfiles

Guía de detección de datos

Guía de detección de datos

Configuración de perfil de columna

Configuración de perfil de columna

Las opciones de muestreo determinan si la Herramienta del analista ejecuta un perfil de columna en todas las filas de los orígenes de datos o se limita a un determinado número de filas.
En la siguiente tabla se describen los ajustes de perfil de columna que se pueden configurar para un perfil de detección empresarial:
Opción
Descripción
Habilitar creación de perfiles de columna
Ejecuta un perfil de columna como parte de la detección empresarial.
Excluye los tipos de datos y los dominios de datos aprobados de la deducción de tipo de datos y del dominio de datos en las siguientes ejecuciones del perfil.
Excluye el tipo de datos o el dominio de datos aprobado de la deducción de tipo de datos y del dominio de datos de la siguiente ejecución del perfil.
En la siguiente tabla se describe la opción de entorno en tiempo de ejecución que se puede configurar para un perfil de detección empresarial:
Opción
Descripción
Native
La Herramienta del analista envía los trabajos de perfil al módulo del servicio de creación de perfiles. A continuación, el módulo del servicio de creación de perfiles divide los trabajos de perfil en un conjunto de asignaciones. El servicio de integración de datos ejecuta estas asignaciones y escribe los resultados de perfil en el almacén de creación de perfiles.
Blaze
El servicio de integración de datos inserta la lógica de perfil en el motor de Blaze en el clúster de Hadoop para ejecutar los perfiles.
Spark
El servicio de integración de datos inserta la lógica de perfil en el motor de Spark en el clúster de Hadoop para ejecutar perfiles.
En la siguiente tabla se describen las opciones de muestreo que se pueden configurar para un perfil de detección empresarial:
Opción
Descripción
Todas las filas
Ejecuta un perfil de columna en todas las filas del origen de datos.
Se admite en el entorno en tiempo de ejecución nativo, de Blaze y de Spark.
Primeras <número> filas
Ejecuta un perfil en las filas de muestra desde el principio de las filas en el objeto de datos. Puede especificar un máximo de 2.147.483.647 filas.
Se admite en el entorno en tiempo de ejecución nativo y de Blaze.
Limitar N <número> filas
Ejecuta un perfil en función del número de filas en el objeto de datos. Cuando se decide ejecutar un perfil en el entorno de validación de Hadoop, el motor de Spark recopila muestras de varias particiones del objeto de datos y las inserta en un único nodo para calcular el tamaño de la muestra. La opción de muestreo Limitar N admite bases de datos de Oracle, de SQL Server y de DB2. No se pueden aplicar filtros avanzados con la opción de muestreo Limitar N. Se puede seleccionar un máximo de 2 147 483 647 filas.
Se admite en el entorno en tiempo de ejecución de Spark.
Porcentaje aleatorio
Ejecuta un perfil en un porcentaje de filas en el objeto de datos.
Se admite en el entorno en tiempo de ejecución de Spark.