La transformación de coincidencia es una transformación activa que analiza los niveles de similitud entre registros. Utilice la transformación de coincidencia para hallar registros que contengan información duplicada en un conjunto de datos o entre dos conjuntos de datos.
La transformación de coincidencia analiza los valores en un puerto de entrada y genera un conjunto de puntuaciones numéricas que representan los grados de similitud entre los valores. Puede seleccionar varios puertos para averiguar los niveles generales entre los registros de entrada. Debe especificar una puntuación mínima como valor de umbral para identificar los registros que probablemente contengan información duplicada.
Puede utilizar la transformación de coincidencia en los siguientes proyectos de datos:
Administración de relaciones con clientes. Por ejemplo, un almacén diseña una campaña de correo y debe comprobar la base de datos de clientes para buscar registros de clientes duplicados.
Fusiones y compras. Por ejemplo, un banco compra a otro banco de la misma zona y los dos bancos tienen clientes común.
Iniciativas de cumplimiento legal. Por ejemplo, una empresa opera de acuerdo con normas gubernamentales o industriales que insisten en que todos los sistemas de datos deben estar desprovistos de datos duplicados.
Administración de riesgos financieros. Por ejemplo, un banco puede desear buscar relaciones entre titulares de cuentas.
Administración de datos principales. Por ejemplo, una cadena minorista tiene una base de datos principal de registros de clientes y cada comercio minorista de la cadena envía registros a la base de datos principal de forma periódica.
Cualquier proyecto que deba identificar registros duplicados en un conjunto de datos.