Wenn Sie eine Datenprozessor-Umwandlung (von relational nach hierarchisch) mit mehreren Gruppen in der Hive-Umgebung erstellen, aktivieren Sie Eingabedaten-Partitionierung, um sicherzustellen, dass Daten für jede Zeile ordnungsgemäß verarbeitet werden. Der Datenintegrationsdienst partitioniert die Eingabezeilen gemäß eines Ports, der als Partitionierungsschlüssel namens Clustering_Key fungiert.
Um Eingabedaten in eine Datenprozessor-Umwandlung in einem Mapping zu partitionieren, wählen Sie die Umwandlung im Mapping aus und aktivieren Sie die Partitionierung auf der Registerkarte
Erweitert
der Ansicht
Eigenschaften
. Wenn Sie Partitionierung aktivieren, erstellt Developer einen Clustering_Key-Port in der Datenprozessor-Umwandlung für jede Eingabegruppe.
Jede Eingabegruppe muss denselben Fremdschlüssel in der Eingabe-Root-Gruppe verwenden, um die Partitionierung zu unterstützen. Um die Daten entsprechend eines Schlüssels zu sortieren, verbinden Sie den relationalen Eingabeport des Fremdschlüssels jedes Datenobjekts mit dem entsprechenden Clustering_Key-Port in der Datenprozessor-Umwandlung. Der Datenintegrationsdienst verwendet den Clustering_Key-Port, um die Daten zu partitionieren und zu verarbeiten.
Sie müssen denselben Schlüssel in allen relationalen Eingabegruppen verwenden. Bei Bedarf können Sie eine Joiner-Umwandlung verwenden, um den Schlüssel zu einer relationalen Eingabegruppe hinzuzufügen, die nicht über diesen Schlüssel verfügt.
Das folgende Bild zeigt ein Mapping mit dem Fremdschlüssel Company_ID in den relationalen Eingabegruppen, die mit den Clustering_Key-Ports in der Datenprozessor-Umwandlung verknüpft sind: