Puede utilizar las nuevas tareas de flujo de trabajo para crear un flujo de trabajo de clúster.
Un flujo de trabajo de clúster crea un clúster en una plataforma de nube y ejecuta asignaciones y otras tareas de flujo de trabajo en el clúster. Puede optar por terminar y eliminar el clúster cuando las tareas de flujo de trabajo se completen con el objetivo de ahorrar recursos en el clúster.
Existen dos nuevas tareas de flujo de trabajo que permiten crear y eliminar un clúster de Hadoop como parte de un flujo de trabajo de clúster:
Crear tarea de clúster
La tarea Crear clúster permite crear, configurar e iniciar un clúster de Hadoop en las siguientes plataformas de nube:
Amazon Web Services (AWS). Puede crear un clúster de Amazon EMR.
Microsoft Azure. Puede crear un clúster de HDInsight.
Eliminar tarea de clúster
La tarea opcional Eliminar clúster permite eliminar un clúster cuando se completan las tareas de asignación y otras tareas de flujo de trabajo. Es posible que desee hacer esto para ahorrar costos.
Antes, se podían utilizar tareas de comando en un flujo de trabajo para crear clústeres en una plataforma de nube. Para obtener más información sobre los flujos de trabajo y las tareas del flujo de trabajo del clúster, consulte la
Guía de flujos de trabajo de Informatica Developer 10.2.1
.
En la versión 10.2.1, el método de tarea de comando para crear y eliminar clústeres es compatible con los clústeres de Cloudera Altus en AWS. Para obtener más información, consulte el artículo "Cómo crear clústeres de Cloudera Altus con un flujo de trabajo de clúster en Big Data Management" en la red de Informatica.
Tarea de asignación
Las propiedades avanzadas de la tarea de asignación incluyen la nueva propiedad ClusterIdentifier. ClusterIdentifier identifica el clúster que se utilizará para ejecutar la tarea de asignación.
Para obtener más información sobre los flujos de trabajo del clúster, consulte la
Guía de flujos de trabajo de Informatica Developer 10.2.1