Índice

Search

  1. Prólogo
  2. Introducción a las transformaciones
  3. Puertos de transformación
  4. Memorias caché de transformaciones
  5. Transformación del validador de direcciones
  6. Transformación de agregación
  7. Transformación de asociación
  8. Transformación de excepción de registros incorrectos
  9. Transformación de conversión de mayúsculas y minúsculas
  10. Transformación de clasificador
  11. Transformación de comparación
  12. Transformación de consolidación
  13. Transformación de enmascaramiento de datos
  14. Transformación del Procesador de datos
  15. Transformación de decisión
  16. Transformación de excepción de registros duplicados
  17. Transformación de expresión
  18. Transformación de filtro
  19. Transformación de jerárquica a relacional
  20. Transformación de Java
  21. Referencia API de transformación de Java
  22. Expresiones de Java
  23. Transformación de incorporación
  24. Transformación de generador de claves
  25. Transformación de etiquetador
  26. Transformación de búsqueda
  27. Memorias caché de búsqueda
  28. Memoria caché de búsqueda dinámica
  29. Transformación de macro
  30. Transformación de coincidencia
  31. Transformaciones de coincidencia en el análisis de campos
  32. Transformaciones de coincidencia en el análisis de identidad
  33. Transformación de normalizador
  34. Transformación de fusión
  35. Transformación de analizador
  36. Transformación de Python
  37. Transformación de rango
  38. Transformación de lectura
  39. Transformación de relacional a jerárquica
  40. Transformación de consumidor de servicio web REST
  41. Transformación de enrutador
  42. Transformación de generador de secuencia
  43. Transformación de ordenación
  44. Transformación de SQL
  45. Transformación de estandarizador
  46. Transformación de unión
  47. Transformación de estrategia de actualización
  48. Transformación de consumidor de servicio web
  49. Análisis de mensajes SOAP del servicio web
  50. Generación de mensajes SOAP del servicio web
  51. Transformación de media ponderada
  52. Transformación de ventana
  53. Transformación de escritura
  54. Apéndice A: Delimitadores de transformación

Guía de transformaciones de Developer

Guía de transformaciones de Developer

Grupos en el análisis de coincidencia

Grupos en el análisis de coincidencia

Una asignación de análisis de coincidencia puede tardar mucho tiempo en ejecutarse debido al número de comparaciones de datos que debe realizar la transformación. El número de comparaciones está relacionado con el número de valores de datos en los puertos que seleccione.
La siguiente tabla muestra el número de cálculos que una asignación realiza para diferentes números de valores de datos en un solo puerto:
Número de valores de datos
Número de comparaciones
10.000
50 millones
100.000
5.000 millones
1 millón
500.000 millones
Para reducir el tiempo que la asignación necesaria para ejecutarse, asigne los registros de datos de entrada a grupos. Un grupo es un conjunto de registros que contienen valores idénticos en un puerto que especifique. Al realizar el análisis de coincidencia en datos agrupados, la transformación de coincidencia analiza los registros dentro de cada grupo. La transformación no compara los registros de un grupo con los registros de otro grupo. Los grupos reducen el número total de comparaciones que la transformación debe realizar sin pérdida de precisión en el análisis de asignación.
Considere las siguientes reglas e instrucciones al organizar los datos en grupos:
  • El puerto en el que agrupe los datos es el puerto de clave de grupo. Un puerto de clave de grupo debe contener un rango de valores duplicados, como un nombre de ciudad o de estado en un conjunto de datos de dirección. Si los datos de asignación no contienen un puerto de clave de grupo utilizable, utilice el generador de claves para crear el puerto a partir de los datos de asignación actuales. Conecte el puerto de salida de clave de grupo de la transformación del generador de claves a la transformación de coincidencia.
    También puede utilizar la transformación del generador de claves para agregar identificadores de secuencia a los datos de asignación.
  • Las operaciones de coincidencia de campos deben especificar un grupo de clave de puerto. Si configura la transformación de coincidencia para análisis de identidad, no seleccione un puerto de clave de grupo. El análisis de identidad genera claves de grupo para los datos de índice de identidad.
  • No especifique un puerto de clave de grupo que vaya a utilizar en el análisis de coincidencia.
  • Cuando cree grupos, debe comprobar que los grupos tienen un tamaño válido. Si los grupos son demasiado pequeños, es posible que el análisis de coincidencias no encuentre todos los datos duplicados del conjunto de datos. Si los grupos son demasiado grandes, el análisis de coincidencia podría devolver falsos duplicados. Seleccione claves de grupo que creen un tamaño medio de grupo de 10.000 registros.
  • Los grupos no cambian la posición de los registros en el conjunto de datos de la asignación.