Índice

Search

  1. Prólogo
  2. Introducción a las transformaciones
  3. Puertos de transformación
  4. Memorias caché de transformaciones
  5. Transformación del validador de direcciones
  6. Transformación de agregación
  7. Transformación de asociación
  8. Transformación de excepción de registros incorrectos
  9. Transformación de conversión de mayúsculas y minúsculas
  10. Transformación de clasificador
  11. Transformación de comparación
  12. Transformación de consolidación
  13. Transformación de enmascaramiento de datos
  14. Transformación del Procesador de datos
  15. Transformación de decisión
  16. Transformación de excepción de registros duplicados
  17. Transformación de expresión
  18. Transformación de filtro
  19. Transformación de jerárquica a relacional
  20. Transformación de Java
  21. Referencia API de transformación de Java
  22. Expresiones de Java
  23. Transformación de incorporación
  24. Transformación de generador de claves
  25. Transformación de etiquetador
  26. Transformación de búsqueda
  27. Memorias caché de búsqueda
  28. Memoria caché de búsqueda dinámica
  29. Transformación de macro
  30. Transformación de coincidencia
  31. Transformaciones de coincidencia en el análisis de campos
  32. Transformaciones de coincidencia en el análisis de identidad
  33. Transformación de normalizador
  34. Transformación de fusión
  35. Transformación de analizador
  36. Transformación de Python
  37. Transformación de rango
  38. Transformación de lectura
  39. Transformación de relacional a jerárquica
  40. Transformación de consumidor de servicio web REST
  41. Transformación de enrutador
  42. Transformación de generador de secuencia
  43. Transformación de ordenación
  44. Transformación de SQL
  45. Transformación de estandarizador
  46. Transformación de unión
  47. Transformación de estrategia de actualización
  48. Transformación de consumidor de servicio web
  49. Análisis de mensajes SOAP del servicio web
  50. Generación de mensajes SOAP del servicio web
  51. Transformación de media ponderada
  52. Transformación de ventana
  53. Transformación de escritura
  54. Apéndice A: Delimitadores de transformación

Guía de transformaciones de Developer

Guía de transformaciones de Developer

Análisis de datos principales

Análisis de datos principales

Cuando se desea analizar dos orígenes de datos en la transformación de coincidencia, debe identificar un origen como el conjunto de datos principales. La transformación compara los valores de datos de cada registro del conjunto de datos especificado con los valores correspondientes de cada registro del otro conjunto de datos.
En muchas organizaciones, un conjunto de datos principales constituye un almacén de datos permanente y de alta calidad. Antes de añadir registros a un conjunto de datos principales, utilice la transformación de coincidencia para comprobar que los registros no añaden información duplicada a los datos principales.

Ejemplo de datos principales

Un banco mantiene un conjunto de datos principales de registros de cuentas de clientes. El banco actualiza el conjunto de datos principales cada día con registros que identifican nuevas cuentas de clientes. El banco utiliza una asignación de análisis de duplicados para comprobar que los nuevos registros no duplican información de clientes en el conjunto de datos principales. El conjunto de datos principales y las tablas de cuentas nuevas tiene una estructura común, y las tablas utilizan el mismo tipo de base de datos. Por tanto, el banco puede reutilizar la asignación de análisis de duplicados cada vez que necesite actualizar el conjunto de datos principales.

Direccionalidad en el análisis del conjunto de datos principal

La transformación de coincidencia compara los registros de un conjunto de datos con los de otro en una única dirección. La transformación compara cada registro del conjunto de datos principal con todos los registros del segundo conjunto de datos. No compara cada registro del segundo conjunto de datos con todos los registros del conjunto de datos principal. En consecuencia, la selección del conjunto de datos principal puede influir en los resultados del análisis de coincidencia.
La siguiente tabla recoge dos conjuntos de datos que se pueden comparar en el análisis de coincidencia de identidad:
Conjunto de datos 1
Conjunto de datos 2
Alex Bell
Alexander Bell
Alexander Graham Bell
Thomas Edison
Alva Edison
Nicola Tesla
Marie Curie
Irene Joliot Curie
Dorothy Crowfoot
Dorothy Hodgkin
Si selecciona el conjunto de datos 1 como conjunto de datos principal y selecciona la opción de salida
Mejor coincidencia
, el resultado incluirá los siguientes registros:
  • Alex Bell, Alexander Bell
  • Alexander Graham Bell, Alexander Bell
Si selecciona el conjunto de datos 2 como conjunto de datos principal y selecciona la opción de salida
Mejor coincidencia
, el resultado incluirá los siguientes registros:
  • Alexander Bell, Alex Bell
Cuando el conjunto de datos 2 es el conjunto de datos principal, la transformación no halla una coincidencia entre Alexander Bell y Alexander Graham Bell, ya que Alexander Bell ya coincide con Alex Bell en los datos de salida.