Índice

Search

  1. Prólogo
  2. Introducción a las transformaciones
  3. Puertos de transformación
  4. Memorias caché de transformaciones
  5. Transformación del validador de direcciones
  6. Transformación de agregación
  7. Transformación de asociación
  8. Transformación de excepción de registros incorrectos
  9. Transformación de conversión de mayúsculas y minúsculas
  10. Transformación de clasificador
  11. Transformación de comparación
  12. Transformación de consolidación
  13. Transformación de enmascaramiento de datos
  14. Transformación del Procesador de datos
  15. Transformación de decisión
  16. Transformación de excepción de registros duplicados
  17. Transformación de expresión
  18. Transformación de filtro
  19. Transformación de jerárquica a relacional
  20. Transformación de Java
  21. Referencia API de transformación de Java
  22. Expresiones de Java
  23. Transformación de incorporación
  24. Transformación de generador de claves
  25. Transformación de etiquetador
  26. Transformación de búsqueda
  27. Memorias caché de búsqueda
  28. Memoria caché de búsqueda dinámica
  29. Transformación de macro
  30. Transformación de coincidencia
  31. Transformaciones de coincidencia en el análisis de campos
  32. Transformaciones de coincidencia en el análisis de identidad
  33. Transformación de normalizador
  34. Transformación de fusión
  35. Transformación de analizador
  36. Transformación de Python
  37. Transformación de rango
  38. Transformación de lectura
  39. Transformación de relacional a jerárquica
  40. Transformación de consumidor de servicio web REST
  41. Transformación de enrutador
  42. Transformación de generador de secuencia
  43. Transformación de ordenación
  44. Transformación de SQL
  45. Transformación de estandarizador
  46. Transformación de unión
  47. Transformación de estrategia de actualización
  48. Transformación de consumidor de servicio web
  49. Análisis de mensajes SOAP del servicio web
  50. Generación de mensajes SOAP del servicio web
  51. Transformación de media ponderada
  52. Transformación de ventana
  53. Transformación de escritura
  54. Apéndice A: Delimitadores de transformación

Guía de transformaciones de Developer

Guía de transformaciones de Developer

Opciones de salida del clúster

Opciones de salida del clúster

Seleccione una opción de salida del clúster cuando quiera organizar registros similares o idénticos en los datos de salida.
Cuando se selecciona una opción de salida del clúster, la transformación añade un valor de ID de clúster a cada registro de salida. Puede ordenar los registros por valor de ID de clúster. La salida de la transformación incluye una fila por cada registro. Si un registro no coincide con otro con una puntuación que satisfaga el umbral de coincidencia, la transformación asigna un ID de clúster único al registro. Utilice la vista
Salida de coincidencia
para seleccionar o actualizar las opciones de salida del clúster.
Puede seleccionar las siguientes opciones de salida del clúster:
Clústeres
Seleccione la opción para asignar valores de ID de clúster a los registros de salida.
Clústeres: mejor coincidencia
Seleccione la opción para añadir el par de registros con la puntuación más alta a un clúster. Dado que un registro podría representar la mejor coincidencia con más de un registro, es posible que más de un par de registros compartan un mismo valor de ID de clúster.
Clústeres: coincidir con todos
La opción
Clústeres: coincidir con todos
funciona de la misma manera que la opción
Clústeres
.
La transformación utiliza
Clústeres: coincidir con todos
y
Clústeres: mejor coincidencia
como nombres de opción en el análisis de coincidencia de identidad.
Si un servicio de integración de datos ejecuta varias transformaciones de coincidencia simultáneamente, el servicio de integración de datos genera valores de ID de clústeres únicos para la salida de cada transformación. Por tanto, los valores de ID de clústeres para los registros que cada transformación genera pueden ser no consecutivos.

La opción Clústeres y la opción Clústeres: coincidir con todos

Seleccione la opción Clústeres en el análisis de coincidencia de campos. Seleccione la opción Clústeres: coincidir con todos en el análisis de coincidencia de identidad.
La transformación de coincidencia utiliza las siguientes reglas para crear los clústeres:
  • Cuando dos registros tienen una puntuación de coincidencia que cumple el umbral de coincidencia, la transformación de coincidencia los añade a un clúster.
  • Cuando un registro del conjunto de datos coincide con cualquier registro del clúster, la transformación añade el registro al clúster.
  • Si un registro de un clúster coincide con un registro de otro clúster, el proceso fusiona los clústeres.
  • La transformación realiza un barrido continuo de los resultados de coincidencias hasta que todos los registros pertenecen a un clúster.
  • Si un registro no coincide con otro en el conjunto de datos, la transformación asigna un valor de ID de clúster único al registro.

La opción Clústeres: mejor coincidencia

Seleccione la opción Clústeres: mejor coincidencia en el análisis de coincidencia de identidad.
La transformación utiliza las siguientes reglas para crear los clústeres:
  • La transformación identifica el registro que tiene la mayor puntuación de coincidencia con el registro actual. Si la puntuación de coincidencia cumple con el umbral, la transformación añade el par de registros a un clúster.
  • Si uno de los registros coincidentes está en un clúster, la transformación añade el otro registro al clúster actual.
  • La transformación realiza un barrido continuo de los resultados de la puntuación de coincidencia hasta que todos los registros pertenecen a un clúster.
  • Un clúster puede contener un único registro si el registro no coincide con ningún otro registro de los datos.
Puede usar la propiedad
Coincidencia
en la vista
Salida de coincidencia
para especificar el modo en que la transformación coteja un único origen de datos con un almacén de datos persistentes. La propiedad
Coincidencia
determina si la transformación busca duplicados en los datos de origen o en el almacén de datos persistentes.