La transformación de coincidencia puede leer y escribir distintos números de filas de entrada y filas de salida, y puede cambiar la secuencia de las filas de salida. Determina el formato de salida para los resultados del análisis de coincidencia.
La transformación puede escribir filas en los formatos siguientes:
Pares de coincidencia
La transformación escribe una fila por cada par de registros que coincide con una puntuación que cumple el umbral de coincidencia. La transformación escribe cada par de registros en una única fila.
Dado que un registro puede coincidir con más de un registro, es posible que aparezca en más de una fila de salida.
Mejor coincidencia
La transformación escribe una fila por cada registro en un conjunto de datos y añade a esa misma fila el registro más parecido de otro conjunto de datos.
Clústeres
La transformación asigna los registros de salida a clústeres según los niveles de parecido entre los registros. Un clúster es un conjunto de registros en el que cada registro coincide al menos con otro registro que tenga una puntuación que cumpla el umbral de coincidencia. La transformación escribe cada registro en una única fila.
Cada registro en un clúster debe coincidir con al menos un registro del clúster. En consecuencia, un clúster puede contener pares de registros que no coincidan entre sí. Un clúster puede contener un único registro si el registro no coincide con ningún otro registro.
La opción Clústeres del análisis de campos se corresponde con la opción Clústeres: coincidir con todos del análisis de identidad. La opción Clústeres: mejor coincidencia del análisis de identidad combina cálculos de clústeres y cálculos de pares de coincidencia.