Índice

Search

  1. Prólogo
  2. Introducción a las transformaciones
  3. Puertos de transformación
  4. Memorias caché de transformaciones
  5. Transformación del validador de direcciones
  6. Transformación de agregación
  7. Transformación de asociación
  8. Transformación de excepción de registros incorrectos
  9. Transformación de conversión de mayúsculas y minúsculas
  10. Transformación de clasificador
  11. Transformación de comparación
  12. Transformación de consolidación
  13. Transformación de enmascaramiento de datos
  14. Transformación del Procesador de datos
  15. Transformación de decisión
  16. Transformación de excepción de registros duplicados
  17. Transformación de expresión
  18. Transformación de filtro
  19. Transformación de jerárquica a relacional
  20. Transformación de Java
  21. Referencia API de transformación de Java
  22. Expresiones de Java
  23. Transformación de incorporación
  24. Transformación de generador de claves
  25. Transformación de etiquetador
  26. Transformación de búsqueda
  27. Memorias caché de búsqueda
  28. Memoria caché de búsqueda dinámica
  29. Transformación de macro
  30. Transformación de coincidencia
  31. Transformaciones de coincidencia en el análisis de campos
  32. Transformaciones de coincidencia en el análisis de identidad
  33. Transformación de normalizador
  34. Transformación de fusión
  35. Transformación de analizador
  36. Transformación de Python
  37. Transformación de rango
  38. Transformación de lectura
  39. Transformación de relacional a jerárquica
  40. Transformación de consumidor de servicio web REST
  41. Transformación de enrutador
  42. Transformación de generador de secuencia
  43. Transformación de ordenación
  44. Transformación de SQL
  45. Transformación de estandarizador
  46. Transformación de unión
  47. Transformación de estrategia de actualización
  48. Transformación de consumidor de servicio web
  49. Análisis de mensajes SOAP del servicio web
  50. Generación de mensajes SOAP del servicio web
  51. Transformación de media ponderada
  52. Transformación de ventana
  53. Transformación de escritura
  54. Apéndice A: Delimitadores de transformación

Guía de transformaciones de Developer

Guía de transformaciones de Developer

Análisis de columnas

Análisis de columnas

Al configurar una transformación de coincidencia, seleccione una o más columnas para el análisis.
La transformación de coincidencia analiza las columnas en parejas. Cuando seleccione una sola columna para el análisis, la transformación crea una copia temporal de la columna y compara la columna de origen con la columna temporal. Cuando seleccione dos columnas para el análisis, la transformación compara los valores entre dos columnas que seleccione. La transformación compara cada valor de una columna con todos los valores de la otra columna. La transformación devuelve una puntuación de coincidencia para cada par de valores que analiza.
Las columnas que analizar se seleccionan al configurar una estrategia en la transformación de coincidencia. La estrategia especifica las columnas que analizar y el algoritmo que aplicar a las columnas. El algoritmo calcula los niveles de similitud entre cada par de valores. Los diferentes algoritmos de la transformación utilizan distintos criterios para medir los niveles de similitud entre los valores. Puede definir varias estrategias de una transformación, así como asignar distintas columnas a cada estrategia.

Ejemplo de análisis de columna

Desea comparar los valores en una columna con datos de apellidos. Cree una asignación que incluya un origen de datos y una transformación de coincidencia. Conecte el puerto
Apellido
a la transformación de coincidencia. La transformación crea una copia temporal de los datos en el puerto
Apellido
cuando la asignación se ejecuta.
La siguiente imagen muestra un fragmento de los datos de apellido:
La hoja de cálculo contiene dos columnas de datos de apellidos. La columna A representa los datos en un puerto de entrada de transformación. La columna B representa la copia temporal de los datos que la transformación genera para el análisis de coincidencia.
La asignación genera un conjunto de puntuaciones de coincidencia que indican que los siguientes valores podrían estar duplicados:
  • Baker, Barker
  • Barker, Parker
  • Smith, Smith
Cuando revise los datos, puede decidir que
Baker, Barker
y
Parker
no son valores duplicados. Puede decidir que
Smith
y
Smith
son valores duplicados.