Sumário

Search

  1. Versão 10.4.0
  2. Versão 10.2.2
  3. Versão 10.2.1
  4. Versão 10.2
  5. Versão 10.1.1
  6. Versão 10.1

Big Data Management

Big Data Management

Esta seção descreve os novos recursos de big data na versão 10.1.1 Atualização 2.
Truncar partições de tabela de Hive em mapeamentos que usam o mecanismo de tempo de execução Blaze
Em vigor na versão 10.1.1 Atualização 2, você pode truncar partições de tabela de Hive em mapeamentos que usam o mecanismo de tempo de execução Blaze.
Para obter mais informações sobre como truncar partições em um destino de Hive, consulte o
Guia do Usuário do Informatica 10.1.1 Atualização 2 Big Data Management
.
Filtros para colunas particionadas no mecanismo Blaze
Em vigor na versão 10.1.1 Atualização 2, o mecanismo Blaze pode empurrar para baixo filtros em colunas particionadas para a origem de Hive para aumentar o desempenho.
Quando um mapeamento contém uma transformação de Filtro em uma coluna particionada de uma origem de Hive, o mecanismo Blaze lê apenas as partições com dados que satisfazem a condição de filtro. Para permitir que o mecanismo Blaze leia partições específicas, a transformação de Filtro deve ser a próxima transformação após a origem no mapeamento.
Para obter mais informações, consulte o
Guia do Usuário do Informatica 10.1.1 Atualização 2 Big Data Management
.
Suporte a OraOop no mecanismo Spark
Em vigor na versão 10.1.1 Atualização 2, você pode configurar o OraOop para executar mapeamentos Sqoop no mecanismo Spark. Quando você lê ou grava dados no Oracle, é possível configurar o argumento direto para permitir que o Sqoop use o OraOop.
OraOop é um plug-in especializado Sqoop para Oracle que usa protocolos nativos para se conectar ao banco de dados Oracle. Quando você configura o OraOop, o desempenho melhora.
Para obter mais informações, consulte o
Guia do Usuário do Informatica 10.1.1 Atualização 2 Big Data Management
.
Suporte Sqoop para mapeamentos nativos Teradata em clusters Cloudera
Em vigor na versão 10.1.1 Atualização 2, se você usar uma conexão Teradata PT para executar um mapeamento em um cluster Cloudera e no mecanismo Blaze, o Serviço de Integração de Dados invocará o Conector Cloudera da plataforma Teradata no tempo de execução. O Serviço de Integração de Dados executa o mapeamento através do Sqoop.
Para obter mais informações, consulte o
Guia do Usuário do Informatica 10.1.1 Atualização 2 PowerExchange for Teradata Parallel Transporter API
.
Suporte do Agendador em Mecanismos de Blaze e Spark
Em vigor na versão 10.1.1 Atualização 2, os seguintes agendadores são válidos para distribuições Hadoop em ambos os mecanismos de Blaze e Spark:
  • Agendador Normal. Atribui recursos a trabalhos de modo que todos os trabalhos recebam, em média, uma quota equitativa de recursos ao longo do tempo.
  • Agendador de Capacidade. Projetado para executar aplicativos Hadoop como um cluster compartilhado multilocatário. Você pode configurar o Agendador de Capacidade com ou sem rotulagem de nó. O rótulo de nó é uma maneira de agrupar nós com características semelhantes.
Para obter mais informações, consulte o capítulo Mapeamentos no Ambiente Hadoop do
Guia do Usuário do Informatica 10.1.1 Atualização 2 Big Data Management
.
Suporte para filas YARN em mecanismos de Blaze e Spark
Em vigor na versão 10.1.1 Atualização 2, você pode direcionar trabalhos no Blaze e no Spark para uma fila específica do agendador YARN. As filas permitem que vários locatários compartilhem o cluster. Quando você envia aplicativos para o YARN, o agendador os atribui a uma fila. Você configura a fila do YARN nas propriedades de conexão Hadoop.
Para obter mais informações, consulte o capítulo Mapeamentos no Ambiente Hadoop do
Guia do Usuário do Informatica 10.1.1 Atualização 2 Big Data Management
.
Recursos de segurança Hadoop no IBM BigInsights 4.2
Em vigor na versão 10.1.1 Atualização 2, você pode usar os seguintes recursos de segurança Hadoop na distribuição do IBM BigInsights 4.2 Hadoop:
  • Apache Knox
  • Apache Ranger
  • HDFS Transparent Encryption
Para obter mais informações, consulte o
Guia do Usuário do Informatica 10.1.1 Atualização 2 Big Data Management Security
.
Modos de segurança SSL/TLS
Em vigor na versão 10.1.1 Atualização 2, você pode usar os modos de segurança SSL e TLS nas distribuições Cloudera e HortonWorks Hadoop, incluindo os seguintes métodos de segurança e plugins:
  • Autenticação Kerberos
  • Apache Ranger
  • Apache Sentry
  • Nomear alta disponibilidade do nó
  • Alta disponibilidade do Gerenciador de Recursos
Para obter mais informações, consulte o
Guia de Instalação e Configuração do Informatica 10.1.1 Atualização 2 Big Data Management
.
Fontes e origens do Hive no Amazon S3
Em vigor na versão 10.1.1 Atualização 2, o Big Data Management suporta a leitura e a gravação em buckets do Hive no Amazon S3 para clusters configurados com as seguintes distribuições Hadoop:
  • Amazon EMR
  • Cloudera
  • HortonWorks
  • MapR
  • BigInsights
Para obter mais informações, consulte o
Guia do Usuário do Informatica 10.1.1 Atualização 2 Big Data Management
.