Sumário

Search

  1. Prefácio
  2. Parte   1: Versão 10.4.1
  3. Parte   2: Versão 10.4.0
  4. Parte   3: Versão 10.2.2
  5. Parte   4: Versão 10.2.1
  6. Parte   5: Versão 10.2
  7. Parte   6: Versão 10.1.1
  8. Parte   7: Versão 10.1

Guia de Versão (10.4.1.1)

Guia de Versão (10.4.1.1)

Fluxos de Trabalho de Cluster

Fluxos de Trabalho de Cluster

Você pode usar novas tarefas de fluxo de trabalho para criar um fluxo de trabalho de cluster.
Um fluxo de trabalho de cluster cria um cluster em uma plataforma de nuvem e executa o mapeamento e outras tarefas de fluxo de trabalho no cluster. Você pode optar por encerrar e excluir o cluster quando as tarefas de fluxo de trabalho estiverem concluídas para salvar os recursos de cluster.
Duas novas tarefas de fluxo de trabalho permitem que você crie e exclua um cluster Hadoop como parte de um fluxo de trabalho de cluster:
Criar tarefa de cluster
A tarefa Criar Cluster permite criar, configurar e iniciar um cluster Hadoop nas seguintes plataformas de nuvem:
  • Amazon Web Services (AWS). Você pode criar um cluster do Amazon EMR.
  • Microsoft Azure. Você pode criar um cluster HDInsight.
Excluir tarefa de cluster
A tarefa opcional Excluir Cluster permite que você exclua um cluster após o mapeamento de tarefas e a conclusão de quaisquer outras tarefas no fluxo de trabalho. Você pode querer fazer isso para reduzir custos.
Anteriormente, você poderia usar tarefas de comando em um fluxo de trabalho para criar clusters em uma plataforma de nuvem. Para obter mais informações sobre fluxos de trabalho de cluster e tarefas de fluxo de trabalho, consulte o
Guia de Fluxo de Trabalho do Informatica 10.2.1 Developer
.
Na versão 10.2.1, o método da tarefa de comando de criação e exclusão de clusters agora oferece suporte a clusters Cloudera Altus na AWS. Para obter mais informações, consulte o artigo "Como criar clusters Cloudera Altus com um fluxo de trabalho de cluster no Big Data Management" na Informatica Network.
Tarefa de Mapeamento
As propriedades avançadas de tarefas de mapeamento incluem uma nova propriedade do ClusterIdentifier. O ClusterIdentifier identifica o cluster a ser usado para executar a tarefa de mapeamento.
Para obter mais informações sobre fluxos de trabalho de cluster, consulte o
Guia de Fluxo de Trabalho do Informatica 10.2.1 Developer
.