Sumário

Search

  1. Prefácio
  2. Introdução às Transformações
  3. Portas de Transformação
  4. Caches de Transformação
  5. Transformação de Validador de Endereço
  6. Transformação de Agregador
  7. Transformação de Associação
  8. Transformação de Exceção de Registro Inválido
  9. Transformação de Conversor de Maiúsculas/Minúsculas
  10. Transformação de Classificador
  11. Transformação de Comparação
  12. Transformação de Consolidação
  13. Transformação de Mascaramento de Dados
  14. Transformação do Processador de Dados
  15. Transformação de Decisão
  16. Transformação de Exceção de Registro Duplicado
  17. Transformação de Expressão
  18. Transformação de Filtro
  19. Transformação Hierárquica para Relacional
  20. Transformação Java
  21. Referência da API da transformação Java
  22. Expressões Java
  23. Transformação de Associador
  24. Transformação de Gerador de Chaves
  25. Transformação de Rotulador
  26. Transformação de Pesquisa
  27. Caches de Pesquisa
  28. Cache de Pesquisa Dinâmica
  29. Transformação de Macro
  30. Transformação de Correspondência
  31. Transformações de Correspondência na Análise de Campos
  32. Transformações de Correspondência na Análise de Identidade
  33. Transformação Normalizador
  34. Transformação de Mesclagem
  35. Transformação de Analisador
  36. Transformação Python
  37. Transformação de Classificação
  38. Transformação de Leitura
  39. Transformação de Relacional para Hierárquica
  40. Transformação de Consumidor de Serviço da Web REST
  41. Transformação de Roteador
  42. Transformação de Gerador de Sequência
  43. Transformação de Ordenador
  44. Transformação SQL
  45. Transformação de Padronizador
  46. Transformação de União
  47. Transformação de Estratégia de Atualização
  48. Transformação de Consumidor de Serviço da Web
  49. Analisando Mensagens SOAP de Serviços da Web
  50. Gerando Mensagens SOAP de Serviços da Web
  51. Transformação de Média Ponderada
  52. Transformação de Janela
  53. Transformação de Gravação
  54. Apêndice A: Delimitadores de Transformação

Guia de Transformação do Developer

Guia de Transformação do Developer

Estudo de Caso do Índice Persistente

Estudo de Caso do Índice Persistente

Você tem um administrador de dados em um banco com várias filiais. Você gerencia um conjunto mestre dos registros de conta do cliente de todas as filiais. Você usa um conjunto de tabelas de banco de dados de índice para verificar se o banco de dados da conta do cliente contém registros redundantes ou duplicados.
Para criar e gerenciar o armazenamento de dados de índice, realize as seguintes operações:
  • Crie o armazenamento de dados.
  • Atualize-o com os dados mais recentes das filiais do banco.
    Você pode adicionar dados da conta ao armazenamento de dados ou atualizar os dados atuais no armazenamento de dados.
  • Remova registros obsoletos do armazenamento de dados.
Você compreende que cada operação pode criar registros duplicados no armazenamento de dados. Você decide desenvolver uma política para analisar os dados das filiais antes de adicioná-los aos dados do armazenamento de dados mestre. Use a análise de correspondência de identidade para analisar os dados das filiais e verificar se eles criam identidades duplicadas no armazenamento de dados. Configure as opções de índice persistente na transformação de Correspondência para analisar os dados das filiais e o armazenamento de dados.

Desenvolver uma Política de Gerenciamento de Dados de Índice Persistente

Como um administrador de dados, você define uma regra comercial que afirma que o armazenamento de dados da conta do cliente não pode conter identidades duplicadas. Você projeta um mapeamento de correspondência de identidade para analisar os dados das filiais em um banco de dados preparação antes de adicioná-los ao armazenamento de dados.
As operações para adicionar os dados das filiais ao armazenamento de dados podem criar identidades duplicadas nos seguintes casos:
  • Os dados das filiais contêm identidades duplicadas.
  • Os dados das filiais contêm uma identidade que o índice também contém.
  • Os dados das filiais contêm uma versão mais recente de uma identidade no armazenamento de dados, e a versão mais recente corresponde a outra identidade no índice.
Quando você comparar o banco de dados de preparação com o armazenamento de dados, selecione as opções de índice persistente que refletem o status de registro duplicado dos dados das filiais. Antes de atualizar o armazenamento de dados, talvez você decida comparar os dados das filiais com os dados de índice.
Você pode ativar e desativar a análise de correspondência em algumas das opções. Ative a análise de correspondência para analisar os dados de mapeamento ou para comparar o armazenamento de dados de índice com os dados de mapeamento. Desative a análise de correspondência quando você não precisar comparar os dados. Você também pode usar a propriedades de correspondência na guia Saída de Correspondência para incluir ou excluir os dados da análise de correspondência.

Comparar uma Fonte de Dados de Mapeamento com o Armazenamento de Dados de Índice

Para comparar os dados de entrada do mapeamento com o armazenamento de dados de índice e para não fazer alterações no armazenamento de dados, selecione a seguinte opção:
  • Não atualizar o banco de dados
O mapeamento compara os dados de entrada com o armazenamento de dados de índice. O mapeamento não adiciona, remove ou atualiza os dados no armazenamento de dados de índice.
Você não pode desativar a análise de correspondência de identidade ao selecionar a opção.
Como você não atualiza os dados de índice, não pode criar linhas duplicadas no armazenamento. Selecione a opção das propriedades de Correspondência na guia Saída de Correspondência que atenda às necessidades atuais do projeto de dados. Por exemplo, selecione a opção
Completa
. A opção
Completa
verifica se os dados de mapeamento contêm duplicatas e se eles adicionam duplicatas ao armazenamento de dados.
Use a opção para comparar os dados de mapeamento e o armazenamento de dados antes de atualizar o armazenamento de dados. Se a saída do mapeamento indicar que os dados de mapeamento não adicionam duplicatas ao armazenamento de dados, execute o mapeamento novamente. Selecione a opção para atualizar o banco de dados quando você executar o mapeamento novamente.

Criar e Adicionar Linhas ao Armazenamento de Dados

Para criar um armazenamento de dados ou para adicionar linhas dos dados de mapeamento a um armazenamento de dados, selecione a seguinte opção:
  • Atualizar o banco de dados com novos IDs
O mapeamento adicionará uma linha ao armazenamento de dados se a linha não compartilhar um identificador de sequência com uma linha no armazenamento de dados. O mapeamento não substitui linhas nas tabelas de índice. Quando você especifica tabelas de banco de dados vazias, o mapeamento grava todos os dados de índice de mapeamento nas tabelas.
Você pode ativar ou desativar a análise de correspondência de identidade ao selecionar a opção. A opção ativa a análise de correspondência por padrão.
Como você não atualiza as linhas de índice, selecione a opção
Exclusiva
ou
Parcial
das propriedades de Correspondência na guia Saída de Correspondência. Use a opção
Exclusiva
se você tiver verificado a exclusividade das linhas de dados de mapeamento em um processo anterior.

Atualizar as Linhas no Armazenamento de Dados

Para atualizar uma linha atual no armazenamento de dados com os dados de mapeamento, selecione a seguinte opção:
  • Atualize os IDs atuais no banco de dados.
O mapeamento atualizará um registro atual no armazenamento de dados se o registro compartilhar um identificador de sequência com um registro nos dados de mapeamento. O mapeamento não adiciona linhas às tabelas de índice.
Você pode ativar ou desativar a análise de correspondência de identidade ao selecionar a opção. A opção desativa a análise de correspondência por padrão.
Como você não adiciona linhas de índice às tabelas de índice, selecione a opção
Completa
das propriedades de Correspondência na guia saída de correspondência.
Ao atualizar as linhas no armazenamento de dados, você espera localizar duplicatas entre os dados de origem de mapeamento e o armazenamento de dados. Selecione a opção
Completa
para verificar se os dados de identidade que você adiciona ao armazenamento correspondem aos dados atuais no armazenamento.

Remover Linhas do Armazenamento de Dados

Para remover linhas do armazenamento de dados, selecione a seguinte opção:
  • Remover IDs do banco de dados
O mapeamento excluirá uma linha do armazenamento de dados se a linha compartilhar um identificador de sequência com um registro nos dados de mapeamento.
Você pode ativar ou desativar a análise de correspondência de identidade ao selecionar a opção. A opção desativa a análise de correspondência por padrão.
Quando você remover os dados de um armazenamento de dados, altere os relacionamentos entre as linhas no armazenamento. Se o armazenamento contiver identidades duplicadas, você poderá remover os dados de um registro de driver ou um registro vinculado em um cluster. Ou você pode remover os dados da melhor correspondência em um par correspondido. Quando você executar o mapeamento novamente, ele poderá gerar diferentes clusters ou pares duplicados. Se você remover linhas de um armazenamento de dados que não contém registros duplicados, não poderá alterar o status duplicado dos registros. Quando você executa o mapeamento depois de excluir as linhas, ele gera as mesmas pontuações de correspondência para as identidades que permanecem no conjunto de dados.