Sumário

Search

  1. Prefácio
  2. Parte   1: Introdução à Descoberta de Dados
  3. Parte   2: Descoberta de Dados com o Informatica Analyst
  4. Parte   3: Descoberta de Dados com o Informatica Developer
  5. Apêndice A: Suporte a funções com base na conexão do warehouse de criação de perfil

Guia de Descoberta de Dados

Guia de Descoberta de Dados

Descoberta do domínio de dados no mecanismo Spark

Descoberta do domínio de dados no mecanismo Spark

Quando você executa um perfil para realizar a descoberta de dados no mecanismo Spark, tabelas de referência são preparadas no cluster Hadoop. Para garantir que as tabelas de referência para todos os domínios de dados sejam preparadas no cluster, você pode realizar as seguintes etapas:

Pré-requisito:

Você deve ter uma permissão para representar o usuário HDFS ao executar uma descoberta de domínio de dados.

Baixe os arquivos .JAR JDBC

  1. Obtenha os arquivos .jar JDBC do banco de dados de referência que você usa. Você pode baixar os arquivos no site do fornecedor do banco de dados.
  2. Copie os arquivos baixados no seguinte local:
    <INFA_HOME>/externaljdbcjars

Configure propriedades personalizadas no Serviço de Integração de Dados

  1. Inicie o Informatica Administrator e selecione o
    Serviço de Integração de Dados
    no
    Navegador deo Domínio
    .
  2. Clique na opção
    Propriedades pPersonalizadas
    opção na
    guia Propriedades
    .
  3. Defina as seguintes propriedades personalizadas para preparar tabelas de referência para os domínios de dados:
    Nome da propriedade
    Valor da propriedade
    AdvancedProfilingServiceOptions.ProfilingSparkReferenceDataHDFSDir
    /tmp/cms
    ExecutionContextOptions.SparkRefTableHadoopConnectorArgs
    --connect <URL de conexão do driver JDBC thin driver connection URL>
  4. Certifique-se de que o diretório
    /tmp/cms
    existe no cluster. Se o diretório não estiver presente, crie o diretório
    /tmp/cms
    ou um diretório personalizado no qual você deseja preparar os dados. Os dados de referência são preparados no diretório
    /tmp/cms
    por padrão.
  5. Recicle o Serviço de Integração de Dados.
  6. Abra a ferramenta Analyst ou a Developer tool e certifique-se de executar um primeiro perfil com todos os domínios de dados para preparar os dados de referência.
Se você não selecionar todos os domínios de dados na primeira execução do perfil e selecionar domínios de dados adicionais na próxima execução do perfil, esta poderá falhar.