Resumen de la transformación de generador de claves
Resumen de la transformación de generador de claves
La transformación de generador de claves es una transformación activa que organiza registros en grupos según los valores de los datos de una columna seleccionada. Utilice esta transformación para ordenar registros antes de pasarlos a la transformación de coincidencia.
La transformación de generador de claves utiliza una estrategia de agrupación para crear claves de grupo para la columna seleccionada. Las estrategias son String, Soundex y NYSIIS. Los registros con valores comunes en el campo seleccionado tienen un valor de clave de grupo común. La transformación de coincidencia procesa simultáneamente los registros con valores de clave de grupo comunes. Esto permite una análisis de duplicados más rápido en la transformación de coincidencia.
El número de operaciones de comparación que debe realizar la transformación de coincidencia aumenta exponencialmente con el número de registros del conjunto de datos. Este aumento exponencial puede consumir cantidades considerables de recursos informáticos. Mediante la creación de claves de grupo, la transformación de generador de claves permite que la transformación de coincidencia compare registros en grupos más pequeños, con lo cual se reduce el tiempo de procesamiento.
Cuando se realice la coincidencia de campos, seleccione una columna para la generación de claves susceptible de proporcionar grupos útiles para las necesidades de coincidencia. Por ejemplo, una columna Apellido es susceptible de proporcionar datos de clave de grupo más relevantes que una columna Nombre. Sin embargo, no utilice la columna Apellido si prevé seleccionar esa columna para un análisis de duplicados en la transformación de coincidencia.
La transformación de generador de claves también puede crear un ID único para cada registro. Cada registro que entra en la transformación de coincidencia debe contener un ID único. Utilice la transformación de generador de claves para crear ID para los datos en el caso de que no exista ninguno.