Sumário

Search

  1. Prefácio
  2. Parte   1: Introdução à Descoberta de Dados
  3. Parte   2: Descoberta de Dados com o Informatica Analyst
  4. Parte   3: Descoberta de Dados com o Informatica Developer
  5. Apêndice A: Suporte a funções com base na conexão do warehouse de criação de perfil

Guia de Descoberta de Dados

Guia de Descoberta de Dados

Criando um perfil de coluna no Informatica Analyst

Criando um perfil de coluna no Informatica Analyst

Você pode criar um perfil personalizado ou um perfil padrão. Ao criar um perfil personalizado, você pode configurar as colunas, as linhas de amostra e as opções de busca detalhada. Ao criar um perfil padrão, o perfil de coluna e a descoberta de domínio de dados são executados em todo o conjunto de dados com todos os domínios de dados.
  1. No espaço de trabalho
    Descoberta
    , clique em
    Perfil
    ou selecione
    Novo
    Perfil
    na área de cabeçalho.
    Você pode clicar com o botão direito do mouse no objeto de dados no espaço de trabalho
    Biblioteca
    e criar um perfil. Nesse perfil, o nome do perfil, o nome da localização e o objeto de dados são extraídos das propriedades do objeto de dados. Você pode criar um perfil padrão ou personalizar as configurações para criar um perfil personalizado.
    O assistente de
    Novo Perfil
    é exibido.
  2. A opção
    Origem única
    é selecionada por padrão. Clique em
    Avançar
    .
  3. Na tela
    Especificar Propriedades Gerais
    , insira um nome e uma descrição opcional para o perfil. No campo Localização, selecione o projeto ou a pasta na qual você deseja criar o perfil. Clique em
    Avançar
    .
  4. Na tela
    Selecionar Origem
    , clique em
    Escolher
    para selecionar um objeto de dados ou clique em
    Novo
    para importar um objeto de dados. Clique em
    Avançar
    .
    • Na caixa de diálogo
      Escolher Objeto de Dados
      , selecione um objeto de dados. Clique em
      OK
      .
      O painel Propriedades exibe as propriedades do objeto de dados selecionado. O painel Visualização de Dados exibe as colunas no objeto de dados.
    • Na caixa de diálogo
      Novo Objeto de Dados
      , você pode escolher uma conexão, um esquema, uma tabela ou uma exibição no qual criar um perfil, selecionar uma localização e criar uma pasta para importar o objeto de dados. Clique em
      OK
      .
  5. Na tela
    Selecionar Origem
    , selecione as colunas nas quais você deseja executar um perfil. Opcionalmente, selecione
    Nome
    para selecionar todas as colunas. Clique em
    Avançar
    .
    Todas as colunas são selecionadas por padrão. A ferramenta Analyst lista as propriedades de coluna, como o nome, tipo de dados, precisão, escala, valor nulo e participantes na chave primária de cada coluna.
  6. Na tela
    Especificar Configurações
    , opte por executar um perfil de coluna, uma descoberta de domínio de dados ou um perfil de coluna e uma descoberta de domínio de dados. Por padrão, a opção de perfil de coluna está selecionada.
    • Escolha
      Executar perfil de coluna
      para executar um perfil de coluna.
    • Escolha
      Executar descoberta de domínio de dados
      para realizar a descoberta de domínio de dados. No painel
      Domínio de dados
      , selecione os domínios de dados que você deseja descobrir, selecione critérios de conformidade e selecione as colunas para a descoberta do domínio de dados na caixa de diálogo
      Editar seleção de colunas para a descoberta do domínio de dados
      .
    • Escolha
      Executar perfil de coluna
      e
      Executar descoberta de domínio de dados
      para executar o perfil de coluna e a descoberta de domínio de dados. Selecione as opções de domínio de dados no painel
      Domínio de dados
      .
      Por padrão, as colunas que você seleciona são para o perfil de coluna e a descoberta de domínio de dados. Clique em
      Editar
      para marcar ou desmarcar colunas para a descoberta de domínio de dados.
    • Escolha dados, colunas ou dados e colunas para executar a descoberta de domínio de dados.
    • Escolha uma opção de amostragem. Você pode escolher
      Todas as linhas (análise completa)
      ,
      Amostra primeiro
      ,
      Amostra aleatória
      ,
      Amostra aleatória (automático)
      ,
      Limitar n
      ou
      Porcentagem aleatória
      como opção de amostragem no painel
      Executar perfil em
      . A opção de amostragem aplica-se a um perfil de coluna e uma descoberta de domínio de dados.
    • Escolha uma opção de busca detalhada. Você pode escolher a opção de busca detalhada
      Ativa
      ou
      Preparado
      ou pode escolher
      Desativar
      para desativar a busca detalhada no painel
      Busca Detalhada
      . Opcionalmente, clique em
      Selecionar Colunas
      para selecionar colunas para fazer uma busca detalhada. Você pode optar por omitir o tipo de dados e a inferência de domínio de dados das colunas com um tipo de dados ou domínio de dados aprovado.
    • Escolha
      Native
      ,
      Blaze
      ,
      Spark
      ou
      Databricks
      como o ambiente de tempo de execução. Se você escolher
      Blaze
      ou
      Spark
      , clique em
      Escolher
      para selecionar uma conexão Hadoop na caixa de diálogo
      Selecionar uma Conexão Hadoop
      . Se você escolher
      Databricks
      , clique em
      Escolher
      para selecionar uma conexão do Databricks.
  7. Clique em
    Avançar
    .
    A tela
    Especificar Regras e Filtros
    é aberta.
  8. Na tela
    Especificar Regras e Filtros
    , é possível realizar as seguintes tarefas:
    • Criar, editar ou excluir uma regra. Você pode aplicar as regras existentes no perfil.
    • Criar, editar ou excluir um filtro.
      Ao criar um scorecard nesse perfil, você pode reutilizar os filtros criados para o perfil.
  9. Clique em
    Salvar e Concluir
    para criar o perfil ou clique em
    Salvar e Executar
    para criar e executar o perfil.