Guía de transformaciones de Developer

10.5
- 10.5.2
- 10.4.0

Anterior Siguiente

Análisis de datos principales

Cuando se desea analizar dos orígenes de datos en la transformación de coincidencia, debe identificar un origen como el conjunto de datos principales. La transformación compara los valores de datos de cada registro del conjunto de datos especificado con los valores correspondientes de cada registro del otro conjunto de datos.

En muchas organizaciones, un conjunto de datos principales constituye un almacén de datos permanente y de alta calidad. Antes de añadir registros a un conjunto de datos principales, utilice la transformación de coincidencia para comprobar que los registros no añaden información duplicada a los datos principales.

Ejemplo de datos principales

Un banco mantiene un conjunto de datos principales de registros de cuentas de clientes. El banco actualiza el conjunto de datos principales cada día con registros que identifican nuevas cuentas de clientes. El banco utiliza una asignación de análisis de duplicados para comprobar que los nuevos registros no duplican información de clientes en el conjunto de datos principales. El conjunto de datos principales y las tablas de cuentas nuevas tiene una estructura común, y las tablas utilizan el mismo tipo de base de datos. Por tanto, el banco puede reutilizar la asignación de análisis de duplicados cada vez que necesite actualizar el conjunto de datos principales.

Direccionalidad en el análisis del conjunto de datos principal

La transformación de coincidencia compara los registros de un conjunto de datos con los de otro en una única dirección. La transformación compara cada registro del conjunto de datos principal con todos los registros del segundo conjunto de datos. No compara cada registro del segundo conjunto de datos con todos los registros del conjunto de datos principal. En consecuencia, la selección del conjunto de datos principal puede influir en los resultados del análisis de coincidencia.

La siguiente tabla recoge dos conjuntos de datos que se pueden comparar en el análisis de coincidencia de identidad:

Conjunto de datos 1	Conjunto de datos 2
Alex Bell	Alexander Bell
Alexander Graham Bell	Thomas Edison
Alva Edison	Nicola Tesla
Marie Curie	Irene Joliot Curie
Dorothy Crowfoot	Dorothy Hodgkin

Si selecciona el conjunto de datos 1 como conjunto de datos principal y selecciona la opción de salida

Mejor coincidencia

, el resultado incluirá los siguientes registros:

Alex Bell, Alexander Bell

Alexander Graham Bell, Alexander Bell

Si selecciona el conjunto de datos 2 como conjunto de datos principal y selecciona la opción de salida

Mejor coincidencia

, el resultado incluirá los siguientes registros:

Alexander Bell, Alex Bell

Cuando el conjunto de datos 2 es el conjunto de datos principal, la transformación no halla una coincidencia entre Alexander Bell y Alexander Graham Bell, ya que Alexander Bell ya coincide con Alex Bell en los datos de salida.

Transformación de coincidencia

Reutilización de la asignación

Descargar guía

Enviar comentarios

Communities

Knowledge Base

Success Portal

Rename Saved Search

Índice

Guía de transformaciones de Developer

Guía de transformaciones de Developer

Análisis de datos principales

Análisis de datos principales

Ejemplo de datos principales

Direccionalidad en el análisis del conjunto de datos principal