Índice

Search

  1. Prólogo
  2. Introducción a las transformaciones
  3. Puertos de transformación
  4. Memorias caché de transformaciones
  5. Transformación del validador de direcciones
  6. Transformación de agregación
  7. Transformación de asociación
  8. Transformación de excepción de registros incorrectos
  9. Transformación de conversión de mayúsculas y minúsculas
  10. Transformación de clasificador
  11. Transformación de comparación
  12. Transformación de consolidación
  13. Transformación de enmascaramiento de datos
  14. Transformación del Procesador de datos
  15. Transformación de decisión
  16. Transformación de excepción de registros duplicados
  17. Transformación de expresión
  18. Transformación de filtro
  19. Transformación de jerárquica a relacional
  20. Transformación de Java
  21. Referencia API de transformación de Java
  22. Expresiones de Java
  23. Transformación de incorporación
  24. Transformación de generador de claves
  25. Transformación de etiquetador
  26. Transformación de búsqueda
  27. Memorias caché de búsqueda
  28. Memoria caché de búsqueda dinámica
  29. Transformación de coincidencia
  30. Transformaciones de coincidencia en el análisis de campos
  31. Transformaciones de coincidencia en el análisis de identidad
  32. Transformación de normalizador
  33. Transformación de fusión
  34. Transformación de analizador
  35. Transformación de Python
  36. Transformación de rango
  37. Transformación de lectura
  38. Transformación de relacional a jerárquica
  39. Transformación de consumidor de servicio web REST
  40. Transformación de enrutador
  41. Transformación de generador de secuencia
  42. Transformación de ordenación
  43. Transformación de SQL
  44. Transformación de estandarizador
  45. Transformación de unión
  46. Transformación de estrategia de actualización
  47. Transformación de consumidor de servicio web
  48. Análisis de mensajes SOAP del servicio web
  49. Generación de mensajes SOAP del servicio web
  50. Transformación de media ponderada
  51. Transformación de ventana
  52. Transformación de escritura
  53. Delimitadores de transformación

Guía de transformaciones de Developer

Guía de transformaciones de Developer

Pares de coincidencia y clústeres

Pares de coincidencia y clústeres

La transformación de coincidencia puede leer y escribir distintos números de filas de entrada y filas de salida, y puede cambiar la secuencia de las filas de salida. Determina el formato de salida para los resultados del análisis de coincidencia.
La transformación puede escribir filas en los formatos siguientes:
Pares de coincidencia
La transformación escribe una fila por cada par de registros que coincide con una puntuación que cumple el umbral de coincidencia. La transformación escribe cada par de registros en una única fila.
Dado que un registro puede coincidir con más de un registro, es posible que aparezca en más de una fila de salida.
Mejor coincidencia
La transformación escribe una fila por cada registro en un conjunto de datos y añade a esa misma fila el registro más parecido de otro conjunto de datos.
Clústeres
La transformación asigna los registros de salida a clústeres según los niveles de parecido entre los registros. Un clúster es un conjunto de registros en el que cada registro coincide al menos con otro registro que tenga una puntuación que cumpla el umbral de coincidencia. La transformación escribe cada registro en una única fila.
Cada registro en un clúster debe coincidir con al menos un registro del clúster. En consecuencia, un clúster puede contener pares de registros que no coincidan entre sí. Un clúster puede contener un único registro si el registro no coincide con ningún otro registro.
La opción Clústeres del análisis de campos se corresponde con la opción Clústeres: coincidir con todos del análisis de identidad. La opción Clústeres: mejor coincidencia del análisis de identidad combina cálculos de clústeres y cálculos de pares de coincidencia.
Configure las opciones de salida en la vista
Salida de coincidencia
de la transformación.