Sie können neue Workflow-Aufgaben verwenden, um einen Cluster-Workflow anzulegen.
Ein Cluster-Workflow erstellt einen Cluster auf einer Cloud-Plattform und führt Zuordnungen und andere Workflow-Aufgaben auf dem Cluster aus. Um Cluster-Ressourcen zu sparen, können Sie den Cluster beenden und löschen, wenn die Workflow-Aufgaben abgeschlossen sind.
Mit zwei neuen Workflow-Aufgaben können Sie einen Hadoop-Cluster als Teil eines Cluster-Workflows erstellen und löschen:
Clusteraufgabe erstellen
Mit der Aufgabe "Cluster erstellen" können Sie einen Hadoop-Cluster auf den folgenden Cloud-Plattformen erstellen, konfigurieren und starten:
Amazon Web Services (AWS). Sie können einen Amazon EMR-Cluster erstellen.
Microsoft Azure. Sie können einen HDInsight-Cluster erstellen.
Clusteraufgabe löschen
Mit der optionalen Aufgabe "Cluster löschen" können Sie einen Cluster löschen, nachdem die Mapping-Aufgaben und alle anderen Aufgaben im Workflow abgeschlossen sind. Dies kann sinnvoll sein, um Kosten zu sparen.
Bisher konnten Sie Befehlsaufgaben in einem Workflow verwenden, um Cluster auf einer Cloud-Plattform zu erstellen. Weitere Informationen zu Cluster-Workflows und Workflow-Aufgaben finden Sie im
Informatica 10.2.1 Handbuch für Arbeitsablauf-Entwickler
.
In 10.2.1 unterstützt die Befehlsaufgabe-Methode zum Erstellen und Löschen von Clustern nun Cloudera Altus-Cluster auf AWS. Weitere Informationen finden Sie im Artikel "How to Create Cloudera Altus Clusters with a Cluster Workflow on Big Data Management" (Erstellen von Cloudera-Altus-Clustern mit einem Cluster-Workflow zur Verwaltung großer Datenmengen) im Informatica-Netzwerk.
Zuordnungsaufgabe
Zu den erweiterten Eigenschaften der Mapping-Aufgabe gehört eine neue ClusterIdentifier-Eigenschaft. ClusterIdentifier identifiziert den Cluster, der zur Ausführung der Mapping-Aufgabe verwendet werden soll.
Weitere Informationen zu Cluster-Workflows finden Sie im
Informatica 10.2.1 Handbuch für Arbeitsablauf-Entwickler