Flujo de proceso para el análisis de coincidencia de identidades
Flujo de proceso para el análisis de coincidencia de identidades
El siguiente flujo de proceso resume los pasos necesarios para configurar una transformación de coincidencia para el análisis de coincidencia de identidades. Puede definir un proceso que utiliza la transformación de coincidencia solamente o que utiliza la transformación de coincidencia y otras transformaciones.
Antes de conectar la transformación de coincidencia a objetos de datos de nivel superior, compruebe que los registros contienen valores únicos de identificador de secuencia. Puede utilizar una transformación de generador de claves para crear los valores. Cuando se realiza el análisis de coincidencia de identidades, también puede organizar los datos de entrada en grupos.
Realice los pasos siguientes en la transformación de coincidencia:
Especifique el análisis de identidad como el tipo de coincidencia y especifique el número de orígenes de datos.
Si configura la transformación para analizar dos conjuntos de datos, seleccione un conjunto de datos principales.
Utilice la vista
Tipo de coincidencia
para establecer el tipo y el número de orígenes de datos.
Identifique la ubicación para guardar los datos de índice. La transformación puede escribir los datos de índice en archivos temporales o guardarlos en tablas de base de datos.
Utilice la vista
Tipo de coincidencia
para especificar el almacén de datos de índice.
Defina una estrategia de análisis de coincidencia. Seleccione un algoritmo de relleno y de comparación y asigne un par de columnas al algoritmo.
La población indica los pares de columnas que seleccionar.
Utilice la vista
Estrategias
para definir la estrategia.
Especifique el método que utiliza la transformación para generar los resultados del análisis de coincidencia.
Establezca el valor del umbral de coincidencia. El umbral de coincidencia es la puntuación mínima que puede identificar a dos registros como duplicados el uno del otro.
Utilice la vista
Salida de coincidencia
para seleccionar el método de salida y el umbral de coincidencia.
Puede establecer el umbral de coincidencia en una transformación de coincidencia o una transformación de media ponderada. Utilice la transformación de media ponderada si va a crear un mapplet de coincidencia.