Ab Version 10.2.2 enthält PowerExchange for Hive die folgenden neuen Funktionen:
Für ein Hive-Ziel können Sie die folgenden Zielschemastrategie-Optionen konfigurieren:
RETAIN – vorhandenes Zielschema beibehalten
CREATE – Tabelle zur Laufzeit erstellen oder ersetzen
APPLYNEWCOLUMNS – Tabelle ändern und nur neue Spalten anwenden
APPLYNEWSCHEMA – Tabelle ändern und neues Schema anwenden
FAIL – fehlerhaftes Mapping, wenn das Zielschema abweicht
Parameter zuweisen
Vor dem Laden von Daten können Sie ein internes oder externes partitioniertes Hive-Ziel trunkieren. Diese Option ist relevant, wenn Sie das Mapping in der Hadoop-Umgebung ausführen.
Sie können eine Lese- oder Schreibumwandlung für Hive im nativen Modus erstellen, um Daten aus einer Hive-Quelle zu lesen oder Daten in ein Hive-Ziel zu schreiben.
Wenn Sie Daten in ein Hive-Ziel schreiben, können Sie für eine Hive-Verbindung die folgenden Eigenschaften konfigurieren:
Hive-Staging-Verzeichnis auf HDFS. Dies steht für das HDFS-Verzeichnis für Hive-Staging-Tabellen. Die Option ist relevant und erforderlich, wenn Sie Daten in ein Hive-Ziel in der nativen Umgebung schreiben.
Name der Hive-Staging-Datenbank. Dies steht für Namespace für Hive-Staging-Tabellen. Diese Option ist relevant, wenn Sie Mappings in der nativen Umgebung ausführen, um Daten in ein Hive-Ziel zu schreiben. Wenn Sie Mappings auf der Blaze- oder Spark-Engine ausführen, ist es nicht erforderlich, den Namen der Hive-Staging-Datenbank in der Hive-Verbindung zu konfigurieren. Der Datenintegrationsdienst verwendet den Wert, den Sie in der Hadoop-Verbindung konfigurieren.
Weitere Informationen finden Sie im
Informatica PowerExchange for Hive 10.2.2-Benutzerhandbuch