Sumário

Search

  1. Prefácio
  2. Introdução às Transformações
  3. Portas de Transformação
  4. Caches de Transformação
  5. Transformação de Validador de Endereço
  6. Transformação de Agregador
  7. Transformação de Associação
  8. Transformação de Exceção de Registro Inválido
  9. Transformação de Conversor de Maiúsculas/Minúsculas
  10. Transformação de Classificador
  11. Transformação de Comparação
  12. Transformação de Consolidação
  13. Transformação de Mascaramento de Dados
  14. Transformação do Processador de Dados
  15. Transformação de Decisão
  16. Transformação de Exceção de Registro Duplicado
  17. Transformação de Expressão
  18. Transformação de Filtro
  19. Transformação Hierárquica para Relacional
  20. Transformação Java
  21. Referência da API da transformação Java
  22. Expressões Java
  23. Transformação de Associador
  24. Transformação de Gerador de Chaves
  25. Transformação de Rotulador
  26. Transformação de Pesquisa
  27. Caches de Pesquisa
  28. Cache de Pesquisa Dinâmica
  29. Transformação de Macro
  30. Transformação de Correspondência
  31. Transformações de Correspondência na Análise de Campos
  32. Transformações de Correspondência na Análise de Identidade
  33. Transformação Normalizador
  34. Transformação de Mesclagem
  35. Transformação de Analisador
  36. Transformação Python
  37. Transformação de Classificação
  38. Transformação de Leitura
  39. Transformação de Relacional para Hierárquica
  40. Transformação de Consumidor de Serviço da Web REST
  41. Transformação de Roteador
  42. Transformação de Gerador de Sequência
  43. Transformação de Ordenador
  44. Transformação SQL
  45. Transformação de Padronizador
  46. Transformação de União
  47. Transformação de Estratégia de Atualização
  48. Transformação de Consumidor de Serviço da Web
  49. Analisando Mensagens SOAP de Serviços da Web
  50. Gerando Mensagens SOAP de Serviços da Web
  51. Transformação de Média Ponderada
  52. Transformação de Janela
  53. Transformação de Gravação
  54. Apêndice A: Delimitadores de Transformação

Guia de Transformação do Developer

Guia de Transformação do Developer

Exceções de Registro Duplicado

Exceções de Registro Duplicado

Você pode usar uma transformação de Exceção de Registro Duplicado para identificar os clusters de duplicação de dados que precisam de revisão manual. As pontuações de correspondência de registros em clusters determinam as duplicações em potencial. Você pode configurar limites superiores e inferiores para pontuações de correspondência na transformação. Os limites superior e inferior definem o grau de similaridade.
Um cluster contém registros relacionados que uma operação de correspondência agrupa. A transformação de Correspondência cria clusters usando a operação de análise de duplicação e a operação de resolução de identidade. Cada registro em um cluster tem o mesmo ID de cluster. Quando a pontuação de correspondência mais baixa em um cluster estiver entre os limites superior e inferior, a transformação de Exceção de Registro Duplicado identificará o cluster como um cluster de Exceção de Registro Duplicado. A transformação de Correspondência adiciona uma coluna de valor de ID de cluster a todos os registros. Os registros duplicados recebem o mesmo ID de cluster.
A pontuação mais baixa do registro em um cluster determina o tipo de cluster. Um cluster pode ter 11 registros com uma pontuação de correspondência de 0,95 e um registro com a pontuação de correspondência de 0,79. Se o limite superior for 0,9 e o limite inferior for 0,8, a transformação de Exceção gravará os registros na tabela de registros exclusivos.