Você tem um administrador de dados em um banco com várias filiais. Você gerencia um conjunto mestre dos registros de conta do cliente de todas as filiais. Você usa um conjunto de tabelas de banco de dados de índice para verificar se o banco de dados da conta do cliente contém registros redundantes ou duplicados.
Para criar e gerenciar o armazenamento de dados de índice, realize as seguintes operações:
Crie o armazenamento de dados.
Atualize-o com os dados mais recentes das filiais do banco.
Você pode adicionar dados da conta ao armazenamento de dados ou atualizar os dados atuais no armazenamento de dados.
Remova registros obsoletos do armazenamento de dados.
Você compreende que cada operação pode criar registros duplicados no armazenamento de dados. Você decide desenvolver uma política para analisar os dados das filiais antes de adicioná-los aos dados do armazenamento de dados mestre. Use a análise de correspondência de identidade para analisar os dados das filiais e verificar se eles criam identidades duplicadas no armazenamento de dados. Configure as opções de índice persistente na transformação de Correspondência para analisar os dados das filiais e o armazenamento de dados.
Desenvolver uma Política de Gerenciamento de Dados de Índice Persistente
Como um administrador de dados, você define uma regra comercial que afirma que o armazenamento de dados da conta do cliente não pode conter identidades duplicadas. Você projeta um mapeamento de correspondência de identidade para analisar os dados das filiais em um banco de dados preparação antes de adicioná-los ao armazenamento de dados.
As operações para adicionar os dados das filiais ao armazenamento de dados podem criar identidades duplicadas nos seguintes casos:
Os dados das filiais contêm identidades duplicadas.
Os dados das filiais contêm uma identidade que o índice também contém.
Os dados das filiais contêm uma versão mais recente de uma identidade no armazenamento de dados, e a versão mais recente corresponde a outra identidade no índice.
Quando você comparar o banco de dados de preparação com o armazenamento de dados, selecione as opções de índice persistente que refletem o status de registro duplicado dos dados das filiais. Antes de atualizar o armazenamento de dados, talvez você decida comparar os dados das filiais com os dados de índice.
Você pode ativar e desativar a análise de correspondência em algumas das opções. Ative a análise de correspondência para analisar os dados de mapeamento ou para comparar o armazenamento de dados de índice com os dados de mapeamento. Desative a análise de correspondência quando você não precisar comparar os dados. Você também pode usar a propriedades de correspondência na guia Saída de Correspondência para incluir ou excluir os dados da análise de correspondência.
Comparar uma Fonte de Dados de Mapeamento com o Armazenamento de Dados de Índice
Para comparar os dados de entrada do mapeamento com o armazenamento de dados de índice e para não fazer alterações no armazenamento de dados, selecione a seguinte opção:
Não atualizar o banco de dados
O mapeamento compara os dados de entrada com o armazenamento de dados de índice. O mapeamento não adiciona, remove ou atualiza os dados no armazenamento de dados de índice.
Você não pode desativar a análise de correspondência de identidade ao selecionar a opção.
Como você não atualiza os dados de índice, não pode criar linhas duplicadas no armazenamento. Selecione a opção das propriedades de Correspondência na guia Saída de Correspondência que atenda às necessidades atuais do projeto de dados. Por exemplo, selecione a opção
Completa
. A opção
Completa
verifica se os dados de mapeamento contêm duplicatas e se eles adicionam duplicatas ao armazenamento de dados.
Use a opção para comparar os dados de mapeamento e o armazenamento de dados antes de atualizar o armazenamento de dados. Se a saída do mapeamento indicar que os dados de mapeamento não adicionam duplicatas ao armazenamento de dados, execute o mapeamento novamente. Selecione a opção para atualizar o banco de dados quando você executar o mapeamento novamente.
Criar e Adicionar Linhas ao Armazenamento de Dados
Para criar um armazenamento de dados ou para adicionar linhas dos dados de mapeamento a um armazenamento de dados, selecione a seguinte opção:
Atualizar o banco de dados com novos IDs
O mapeamento adicionará uma linha ao armazenamento de dados se a linha não compartilhar um identificador de sequência com uma linha no armazenamento de dados. O mapeamento não substitui linhas nas tabelas de índice. Quando você especifica tabelas de banco de dados vazias, o mapeamento grava todos os dados de índice de mapeamento nas tabelas.
Você pode ativar ou desativar a análise de correspondência de identidade ao selecionar a opção. A opção ativa a análise de correspondência por padrão.
Como você não atualiza as linhas de índice, selecione a opção
Exclusiva
ou
Parcial
das propriedades de Correspondência na guia Saída de Correspondência. Use a opção
Exclusiva
se você tiver verificado a exclusividade das linhas de dados de mapeamento em um processo anterior.
Atualizar as Linhas no Armazenamento de Dados
Para atualizar uma linha atual no armazenamento de dados com os dados de mapeamento, selecione a seguinte opção:
Atualize os IDs atuais no banco de dados.
O mapeamento atualizará um registro atual no armazenamento de dados se o registro compartilhar um identificador de sequência com um registro nos dados de mapeamento. O mapeamento não adiciona linhas às tabelas de índice.
Você pode ativar ou desativar a análise de correspondência de identidade ao selecionar a opção. A opção desativa a análise de correspondência por padrão.
Como você não adiciona linhas de índice às tabelas de índice, selecione a opção
Completa
das propriedades de Correspondência na guia saída de correspondência.
Ao atualizar as linhas no armazenamento de dados, você espera localizar duplicatas entre os dados de origem de mapeamento e o armazenamento de dados. Selecione a opção
Completa
para verificar se os dados de identidade que você adiciona ao armazenamento correspondem aos dados atuais no armazenamento.
Remover Linhas do Armazenamento de Dados
Para remover linhas do armazenamento de dados, selecione a seguinte opção:
Remover IDs do banco de dados
O mapeamento excluirá uma linha do armazenamento de dados se a linha compartilhar um identificador de sequência com um registro nos dados de mapeamento.
Você pode ativar ou desativar a análise de correspondência de identidade ao selecionar a opção. A opção desativa a análise de correspondência por padrão.
Quando você remover os dados de um armazenamento de dados, altere os relacionamentos entre as linhas no armazenamento. Se o armazenamento contiver identidades duplicadas, você poderá remover os dados de um registro de driver ou um registro vinculado em um cluster. Ou você pode remover os dados da melhor correspondência em um par correspondido. Quando você executar o mapeamento novamente, ele poderá gerar diferentes clusters ou pares duplicados. Se você remover linhas de um armazenamento de dados que não contém registros duplicados, não poderá alterar o status duplicado dos registros. Quando você executa o mapeamento depois de excluir as linhas, ele gera as mesmas pontuações de correspondência para as identidades que permanecem no conjunto de dados.