Puede utilizar una transformación de excepción de registros duplicados para identificar clústeres de datos duplicados que necesitan revisión manual. Las puntuaciones de coincidencia de registros en clústeres determina los posibles duplicados. Puede configurar los umbrales superior e inferior para las puntuaciones de coincidencia de la transformación. El los umbrales superior e inferior defina el grado de similitud.
Un clúster contiene registros relacionados que una operación de coincidencia agrupa simultáneamente. La transformación de coincidencia crea clústeres con la operación de análisis de duplicados y la operación de resolución de identidad. Cada registro de un clúster tiene el mismo ID de clúster. Cuando la puntuación de coincidencia menor de un clúster está entre los umbrales superior e inferior, la transformación de excepción de registros duplicados identifica el clúster como un clúster de excepción de registros duplicados. La transformación de coincidencia añade una columna de valor de ID de clúster todos los registros. Los registros duplicados reciben el mismo ID de clúster.
La puntuación de registro más baja determina el tipo de clúster. Un clúster podría tener 11 registros que tienen una puntuación de coincidencia de 0,95 y un registro con la puntuación de coincidencia de 0,79. Si el umbral superior es 0,9 y el umbral inferior es 0,8, la transformación de excepción escribe los registros en la tabla de registros únicos.