Sumário

Search

  1. Prefácio
  2. Entendendo Domínios
  3. Gerenciando Sua Conta
  4. Usando o Informatica Administrator
  5. Usando a Exibição Domínio
  6. Gerenciamento de Domínio
  7. Nós
  8. Alta Disponibilidade
  9. Conexões
  10. Propriedades de Conexão
  11. Agendamentos
  12. Exportação e importação do objeto de domínio
  13. Gerenciamento de licenças
  14. Monitoramento
  15. Gerenciamento de Logs
  16. Relatórios de domínio
  17. Diagnóstico de nó
  18. Noções Básicas de Globalização
  19. Apêndice A: Páginas de Códigos
  20. Apêndice B: Funções personalizadas
  21. Apêndice C: Conectividade da Plataforma Informatica
  22. Apêndice D: Configurar o Navegador da Web

Guia do Administrador

Guia do Administrador

Propriedades de Cluster Hadoop

Propriedades de Cluster Hadoop

Configure as propriedades na conexão do Hadoop para permitir a comunicação entre o Serviço de Integração de Dados e o cluster Hadoop.
A tabela a seguir descreve as propriedades de conexão geral para a conexão do Hadoop:
Propriedade
Descrição
Nome
O nome da conexão. O nome não faz distinção entre maiúsculas e minúsculas, e deve ser exclusivo no domínio. Você pode alterar essa propriedade após criar a conexão. O nome não pode exceder 128 caracteres, conter espaços nem conter os seguintes caracteres especiais:
~ ` ! $ % ^ & * ( ) - + = { [ } ] | \ : ; " ' < , > . ? /
ID
Cadeia que o Serviço de Integração de Dados usa para identificar a conexão. O ID não diferencia maiúsculas de minúsculas. Ele deve ser de 255 caracteres ou menos e deve ser exclusivo no domínio. Você não poderá alterar essa propriedade depois de criar a conexão. O valor padrão é o nome da conexão.
Descrição
A descrição da conexão. Insira uma cadeia que você pode usar para identificar a conexão. A descrição não pode ter mais de 4.000 caracteres.
Configuração do Cluster
O nome da configuração de cluster associada ao ambiente Hadoop.
Obrigatório se você não definir a Configuração de Provisionamento da Nuvem.
Configuração de Provisionamento da Nuvem
Nome da configuração de provisionamento da nuvem associada a uma plataforma de nuvem, como o Amazon AWS ou o Microsoft Azure.
Obrigatório se você não definir a Configuração de Cluster.
Variáveis de Ambiente de Cluster*
Variáveis de ambiente usadas pelo cluster Hadoop.
Se você usar um cluster Cloudera CDH 6.x ou Cloudera CDP, defina a configuração de localidade como variáveis de ambiente do cluster. No Cloudera Manager, você também deve adicionar as variáveis de ambiente à seguinte propriedade YARN:
yarn.nodemanager.env-whitelist
Por exemplo, a variável ORACLE_HOME representa o diretório no qual o software cliente do banco de dados Oracle está instalado.
Você pode configurar as propriedades de tempo de execução para o ambiente do Hadoop no Serviço de Integração de Dados, na conexão do Hadoop e no mapeamento. Você pode substituir uma propriedade configurada em um nível alto, definindo o valor em um nível inferior. Por exemplo, se você configurar uma propriedade nas propriedades personalizadas do Serviço de Integração de Dados, poderá substituí-la na conexão do Hadoop ou no mapeamento. O Serviço de Integração de Dados processa substituições de propriedade com base nas seguintes prioridades:
  1. Mapeando propriedades personalizadas definidas usando
    infacmd ms runMapping
    com a opção
    -cp
  2. Mapeando as propriedades de tempo de execução para o ambiente Hadoop
  3. Propriedades avançadas de conexão do Hadoop para os mecanismos de tempo de execução
  4. Propriedades gerais avançadas de conexão do Hadoop, variáveis de ambiente e classpaths
  5. Propriedades personalizadas do Serviço de Integração de Dados
Caminho da Biblioteca de Clusters*
O caminho para bibliotecas compartilhadas no cluster.
A variável $DEFAULT_CLUSTER_LIBRARY_PATH contém uma lista de diretórios padrão.
Classpath do Cluster*
O classpath para acessar os arquivos jar do Hadoop e as bibliotecas necessárias.
A variável $DEFAULT_CLUSTER_CLASSPATH contém uma lista de caminhos para os arquivos jar e as bibliotecas padrão.
Você pode configurar as propriedades de tempo de execução para o ambiente do Hadoop no Serviço de Integração de Dados, na conexão do Hadoop e no mapeamento. Você pode substituir uma propriedade configurada em um nível alto, definindo o valor em um nível inferior. Por exemplo, se você configurar uma propriedade nas propriedades personalizadas do Serviço de Integração de Dados, poderá substituí-la na conexão do Hadoop ou no mapeamento. O Serviço de Integração de Dados processa substituições de propriedade com base nas seguintes prioridades:
  1. Mapeando propriedades personalizadas definidas usando
    infacmd ms runMapping
    com a opção
    -cp
  2. Mapeando as propriedades de tempo de execução para o ambiente Hadoop
  3. Propriedades avançadas de conexão do Hadoop para os mecanismos de tempo de execução
  4. Propriedades gerais avançadas de conexão do Hadoop, variáveis de ambiente e classpaths
  5. Propriedades personalizadas do Serviço de Integração de Dados
Caminho Executável do Cluster*
O caminho para arquivos executáveis no cluster.
A variável $DEFAULT_CLUSTER_EXEC_PATH contém uma lista de caminhos para os arquivos executáveis padrão.
* A Informatica não recomenda a alteração desses valores de propriedade antes de consultar a documentação de terceiros, a documentação da Informatica ou o Suporte ao Cliente Global da Informatica. Se você alterar um valor sem o conhecimento da propriedade, poderá haver degradação do desempenho ou outros resultados inesperados.