Índice

Search

  1. Prólogo
  2. Introducción a las transformaciones
  3. Puertos de transformación
  4. Memorias caché de transformaciones
  5. Transformación del validador de direcciones
  6. Transformación de agregación
  7. Transformación de asociación
  8. Transformación de excepción de registros incorrectos
  9. Transformación de conversión de mayúsculas y minúsculas
  10. Transformación de clasificador
  11. Transformación de comparación
  12. Transformación de consolidación
  13. Transformación de enmascaramiento de datos
  14. Transformación del Procesador de datos
  15. Transformación de decisión
  16. Transformación de excepción de registros duplicados
  17. Transformación de expresión
  18. Transformación de filtro
  19. Transformación de jerárquica a relacional
  20. Transformación de Java
  21. Referencia API de transformación de Java
  22. Expresiones de Java
  23. Transformación de incorporación
  24. Transformación de generador de claves
  25. Transformación de etiquetador
  26. Transformación de búsqueda
  27. Memorias caché de búsqueda
  28. Memoria caché de búsqueda dinámica
  29. Transformación de coincidencia
  30. Transformaciones de coincidencia en el análisis de campos
  31. Transformaciones de coincidencia en el análisis de identidad
  32. Transformación de normalizador
  33. Transformación de fusión
  34. Transformación de analizador
  35. Transformación de Python
  36. Transformación de rango
  37. Transformación de lectura
  38. Transformación de relacional a jerárquica
  39. Transformación de consumidor de servicio web REST
  40. Transformación de enrutador
  41. Transformación de generador de secuencia
  42. Transformación de ordenación
  43. Transformación de SQL
  44. Transformación de estandarizador
  45. Transformación de unión
  46. Transformación de estrategia de actualización
  47. Transformación de consumidor de servicio web
  48. Análisis de mensajes SOAP del servicio web
  49. Generación de mensajes SOAP del servicio web
  50. Transformación de media ponderada
  51. Transformación de ventana
  52. Transformación de escritura
  53. Delimitadores de transformación

Guía de transformaciones de Developer

Guía de transformaciones de Developer

Caso práctico de índice persistente

Caso práctico de índice persistente

Usted es gestor de datos en una entidad bancaria con diversas sucursales. Administra un conjunto principal de registros de cuentas de clientes de todas las sucursales. Utiliza un conjunto de tablas de base de datos de índice para comprobar que la base de datos de cuentas de clientes no contiene registros redundantes ni duplicados.
Para crear y administrar el almacén de datos de índice, puede realizar las operaciones siguientes:
  • Crea el almacén de datos.
  • Actualiza el almacén de datos con los datos más recientes de las sucursales bancarias.
    Puede agregar datos de cuentas al almacén de datos o puede actualizar los datos actuales del almacén de datos.
  • Quita registros obsoletos del almacén de datos.
Es consciente de que cada operación podría crear registros duplicados en el almacén de datos. Decide desarrollar una política para analizar los datos de sucursales antes de agregarlos a los datos del almacén de datos principal. Utiliza el análisis de coincidencia de identidades para analizar los datos de sucursales y para comprobar que los datos no crean identidades duplicadas en el almacén de datos. Configura las opciones de índice persistente en la transformación de coincidencia para analizar los datos de sucursales y el almacén de datos.

Desarrollar una política para la administración de datos de índice persistentes

Como gestor de datos, define una regla empresarial que indica que el almacén de datos de cuentas de clientes no puede contener identidades duplicadas. Diseña asignación de coincidencia de identidad para analizar los datos de sucursales en una base de datos de ensayo antes de agregar los datos al almacén de datos.
Las operaciones para agregar los datos de sucursales al almacén de datos pueden crear identidades duplicadas en los casos siguientes:
  • Los datos de sucursales contienen identidades duplicadas.
  • Los datos de sucursales contienen una identidad que el índice también contiene.
  • Los datos de sucursales contienen una versión más reciente de una identidad en el almacén de datos y la versión más reciente coincide con otra identidad en el índice.
Al comparar la base de datos de ensayo con el almacén de datos, seleccione las opciones de índice persistente que reflejan el estado de registro duplicado de los datos de sucursales. Antes de actualizar el almacén de datos, puede decidir comparar los datos de sucursales con los datos de índice.
Puede activar y desactivar el análisis de coincidencia en algunas de las opciones. Habilite el análisis de coincidencia para analizar los datos de la asignación o para comparar el almacén de datos de índice con los datos de la asignación. Desactive el análisis de coincidencia cuando no necesite comparar los datos. También puede utilizar las propiedades de coincidencia de la ficha Salida de coincidencia para incluir o excluir los datos del análisis de coincidencia.

Comparar un origen de datos de asignación con el almacén de datos de índice

Para comparar los datos de entrada de la asignación con el almacén de datos de índice sin realizar cambios en el almacén de datos, seleccione la opción siguiente:
  • No actualizar la base de datos
La asignación compara los datos de entrada con el almacén de datos de índice. La asignación no añade, quita ni actualiza datos del almacén de datos de índice.
No puede desactivar el análisis de coincidencia de identidad si selecciona la opción.
Dado que no actualiza los datos de índice, no puede crear filas duplicadas en el almacén. Seleccione la opción de las propiedades de coincidencia de la ficha Salida de coincidencia que cumpla las necesidades actuales del proyecto de datos. Por ejemplo, seleccione la opción
Completo
. La opción
Completo
comprueba que los datos de asignación no contienen duplicados y verifica que los datos de asignación no agregan duplicados al almacén de datos.
Utilice la opción para comparar los datos de asignación y el almacén de datos antes de actualizar el almacén de datos. Si la salida de asignación indica que los datos de asignación no agregan duplicados al almacén de datos, ejecute la asignación de nuevo. Seleccione la opción para actualizar la base de datos al ejecutar la asignación de nuevo.

Crear el almacén de datos y agregar filas al almacén de datos

Para crear un almacén de datos o agregar filas de los datos de asignación a un almacén de datos, seleccione la opción siguiente:
  • Actualizar la base de datos con ID nuevos
La asignación agrega una fila al almacén de datos si la fila no comparte un identificador de secuencia con una fila del almacén de datos. La asignación no sobrescribe ninguna fila en las tablas de índices. Al especificar tablas de base de datos vacías, la asignación escribe todos los datos de índice de la asignación en las tablas.
Puede activar o desactivar el análisis de coincidencia de identidad si selecciona la opción. La opción habilita el análisis de coincidencia de forma predeterminada.
Dado que no actualiza las filas de índice, seleccione la opción
Exclusivo
o la opción
Parcial
en las propiedades de coincidencia en la ficha Salida de coincidencia. Utilice la opción
Exclusivo
si ha comprobado la exclusividad de las filas de datos de asignación en un proceso anterior.

Actualizar las filas en el almacén de datos

Para actualizar una fila actual en el almacén de datos con los datos de asignación, seleccione la opción siguiente:
  • Actualizar los identificadores en la base de datos
La asignación actualiza un registro actual en el almacén de datos si el registro comparte un identificador de secuencia con un registro de los datos de la asignación. La asignación no añade ninguna fila a las tablas de índices.
Puede activar o desactivar el análisis de coincidencia de identidad si selecciona la opción. La opción desactiva el análisis de coincidencia de forma predeterminada.
Dado que no añade filas de índice a las tablas de índices, seleccione la opción
Completo
de las propiedades de coincidencia en la ficha Salida de coincidencia.
Al actualizar las filas en el almacén de datos, espera encontrar duplicados entre los datos de origen de la asignación y el almacén de datos. Seleccione la opción
Completo
para comprobar que los datos de identidad que añade al almacén no coinciden con los datos actuales del almacén.

Eliminar filas en el almacén de datos

Para eliminar las filas del almacén de datos, seleccione la opción siguiente:
  • Quitar los ID de la base de datos
La asignación elimina una fila del almacén de datos si la fila comparte un identificador de secuencia con un registro de los datos de la asignación.
Puede activar o desactivar el análisis de coincidencia de identidad si selecciona la opción. La opción desactiva el análisis de coincidencia de forma predeterminada.
Al quitar datos de un almacén de datos, cambie las relaciones entre las filas en el almacén. Si el almacén contiene identidades duplicadas, puede quitar datos de un registro del controlador o un registro vinculado en un clúster. También puede eliminar datos de la mejor coincidencia de un par de coincidencia. Cuando ejecute la asignación de nuevo, la asignación podría generar diferentes pares duplicados o clústeres. Si quita filas de un almacén de datos que no contiene registros duplicados, no puede cambiar el estado duplicado de los registros. Cuando ejecute la asignación después de eliminar las filas, la asignación genera las mismas puntuaciones de coincidencia para las identidades que permanecen en el conjunto de datos.