Visão Geral da Transformação de Exceção de Registro Duplicado
Visão Geral da Transformação de Exceção de Registro Duplicado
A transformação de Exceção de Registro Duplicado é uma transformação ativa que lê a saída de um processo de qualidade de dados e identifica registros duplicados que exigem revisão manual. A transformação de Exceção de Registro Duplicado é uma transformação de vários grupos.
A transformação de Exceção de Registro Duplicado recebe entrada de outra transformação ou de um objeto de dados em outro mapeamento. A entrada para a transformação de Exceção deve conter uma sequência numérica de pontuação de correspondência que a transformação pode usar para determinar se o registro é uma duplicação. Defina um limite de pontuação de correspondência superior e inferior na transformação de Exceção de Registro Duplicado.
A transformação de Exceção de Registro Duplicado executa uma das ações a seguir:
Se a pontuação de correspondência for maior ou igual ao limite superior, a transformação tratará o registro como uma duplicação e gravará em um destino de banco de dados.
Se a pontuação de correspondência for menor do que o limite superior e maior do que o limite inferior, a transformação tratará o registro como uma possível duplicação e gravará em um registro para outro destino para revisão manual. Se o registro pertencer a um cluster, a transformação gravará todos os registros do cluster no destino.
Quando um cluster tem uma pontuação de correspondência menor que o limite inferior, todos os registros no cluster vão para o grupo de saída de registros exclusivos. Os clusters de tamanho 1 estão roteados para o grupo exclusivo, independentemente da pontuação de correspondência. Por padrão, a transformação de Exceção não grava registros exclusivos em um destino. Você pode configurar a transformação para retornar os registros exclusivos.
Se alguma pontuação de correspondência em um cluster não estiver no intervalo entre 0 - 100, a transformação de Exceção ignorará todas as linhas no cluster. O Serviço de Integração de Dados registrará uma mensagem que inclui o clusterID.