Sumário

Search

  1. Prefácio
  2. Parte   1: Introdução à Descoberta de Dados
  3. Parte   2: Descoberta de Dados com o Informatica Analyst
  4. Parte   3: Descoberta de Dados com o Informatica Developer
  5. Apêndice A: Suporte a funções com base na conexão do warehouse de criação de perfil

Guia de Descoberta de Dados

Guia de Descoberta de Dados

Visão Geral dos Conceitos de Perfil da Coluna

Visão Geral dos Conceitos de Perfil da Coluna

Um perfil de coluna determina as características das colunas em uma fonte de dados, como a frequência de valor, porcentagens e padrões.
A criação de perfil de coluna revela os seguintes fatos sobre dados:
  • O número de valores nulos, distintos e não distintos em cada coluna, expresso como um número e uma porcentagem.
  • Os padrões de dados em cada coluna e as frequências com que esses valores ocorrerem.
  • As estatísticas sobre os valores de coluna, como o número máximo e mínimo de tamanhos de valores e o primeiro e o último valores em cada coluna.
  • Tipos de dados documentados, tipos de dados inferidos e possíveis conflitos entre os tipos de dados documentados e inferidos.
  • Exceções de frequência de valor e padrão.
Você pode configurar as seguintes opções ao criar ou editar um perfil:
  • Opções de perfil de coluna. É possível selecionar as colunas nas quais você deseja executar um perfil e escolher uma opção de amostragem e uma opção de busca detalhada.
  • Adicionar, editar ou excluir filtros e regras.
Nos resultados do perfil, você pode adicionar comentários e marcas a um perfil e às colunas em um perfil. Termos comerciais podem ser atribuídos a colunas.
O repositório do Modelo usa bloqueios de perfis de repositório para bloquear perfis e, assim, impedir que os usuários sobrescrevam trabalhos. O sistema de controle de versão salva várias versões de um perfil e atribui um número de versão a cada uma. Você pode fazer o check-out de um perfil e então submetê-lo a check-in depois de fazer alterações. É possível desfazer a ação de check-out de um perfil antes de submetê-lo novamente a check-in.
Crie scorecards para analisar periodicamente a qualidade de dados. Crie scorecards antes e depois de aplicar regras para criação de perfis de forma que você possa exibir uma representação gráfica dos valores válidos para as colunas.
Use o Serviço de Agendador para agendar execuções de perfil e de scorecard em um horário específico ou em intervalos. O Serviço de Agendador gerencia agendamentos para perfis, scorecards, mapeamentos implantados e fluxos de trabalho implantados. Você pode criar, gerenciar e executar agendamentos no Informatica Administrator.