Flujo de proceso para el análisis de coincidencia de campos
Flujo de proceso para el análisis de coincidencia de campos
El siguiente flujo de procesos resume los pasos necesarios para configurar una transformación de coincidencia para el análisis de coincidencia de campos. Puede definir un proceso que utiliza la transformación de coincidencia solamente o que utiliza la transformación de coincidencia y otras transformaciones.
Cuando se añade una transformación de coincidencia a una asignación en el análisis de coincidencia de campos, añada una transformación de generador de claves de nivel superior a la asignación.
Para preparar los datos para la transformación de coincidencia, realice los pasos siguientes:
Organice los registros de datos de origen en grupos.
Utilice una transformación de generador de claves para asignar un valor de clave de grupo a cada registro. Las asignaciones de grupos reducen el número de cómputos que debe realizar la transformación de coincidencia.
Compruebe que los registros del origen de datos contienen valores únicos de identificadores de secuencia. Puede utilizar una transformación de generador de claves para crear los valores.
Realice los pasos siguientes en la transformación de coincidencia:
Especifique el análisis de campos como el tipo de coincidencia y especifique el número de orígenes de datos.
Si configura la transformación para analizar dos conjuntos de datos, seleccione un conjunto de datos principales.
Utilice la vista
Tipo de coincidencia
para establecer el tipo y el número de orígenes de datos.
Defina una estrategia de análisis de coincidencia. Seleccione un algoritmo y asigne un par de columnas al algoritmo.
Utilice la vista
Estrategias
para definir la estrategia.
Especifique el método que utiliza la transformación para generar los resultados del análisis de coincidencia.
Establezca el valor del umbral de coincidencia. El umbral de coincidencia es la puntuación mínima que puede identificar a dos registros como duplicados el uno del otro.
Utilice la vista
Salida de coincidencia
para seleccionar el método de salida y el umbral de coincidencia.
Puede establecer el umbral de coincidencia en una transformación de coincidencia o una transformación de media ponderada. Utilice la transformación de media ponderada si va a crear un mapplet de coincidencia.