Inhaltsverzeichnis

Search

  1. Vorwort
  2. Informatica Developer
  3. Das Modellrepository
  4. Suchvorgänge in Informatica Developer
  5. Verbindungen
  6. Physische Datenobjekte
  7. Einfachdatei-Datenobjekte
  8. Logische Datenansicht
  9. Anzeigen von Daten
  10. Anwendungsbereitstellung
  11. Bereitstellung von Anwendungs-Patches
  12. Bereitstellung von Anwendungs-Patches Beispiel
  13. Continuous Integration und Continuous Delivery (CI/CD)
  14. Objekt-Import und -Export
  15. Anhang A: Datentypreferenz
  16. Anhang B: Tastenkombinationen
  17. Anhang C: Verbindungseigenschaften

Handbuch zum Developer Tool

Handbuch zum Developer Tool

Eigenschaften des Hadoop-Clusters

Eigenschaften des Hadoop-Clusters

Konfigurieren Sie Eigenschaften in der Hadoop-Verbindung, um Kommunikation zwischen dem Datenintegrationsdienst und dem Hadoop-Cluster zu ermöglichen.
In der folgenden Tabelle werden die allgemeinen Verbindungseigenschaften für die Hadoop-Verbindung beschrieben:
Eigenschaft
Beschreibung
Name
Der Name der Verbindung. Der Name unterliegt nicht der Groß-/Kleinschreibung und muss innerhalb der Domäne eindeutig sein. Sie können diese Eigenschaft nach dem Erstellen der Verbindung ändern. Der Name darf nicht mehr als 128 Zeichen und weder Leerzeichen noch die folgenden Sonderzeichen enthalten:
~ ` ! $ % ^ & * ( ) - + = { [ } ] | \ : ; " ' < , > . ? /
ID
Zeichenfolge, die der Datenintegrationsdienst zum Erkennen der Verbindung verwendet. Bei der ID wird die Groß- und Kleinschreibung nicht beachtet. Sie darf maximal 255 Zeichen umfassen und muss in der Domäne eindeutig sein. Sie können diese Eigenschaft nach dem Erstellen der Verbindung nicht mehr ändern. Als Standardwert dient der Verbindungsname.
Beschreibung
Die Beschreibung der Verbindung. Geben Sie eine Zeichenfolge ein, mit der Sie die Verbindung angeben können. Die Beschreibung darf nicht mehr als 4.000 Zeichen enthalten.
Cluster-Konfiguration
Der Name der mit der Hadoop-Umgebung verknüpften Cluster-Konfiguration.
Erforderlich, wenn Sie die Cloud-Bereitstellungskonfiguration nicht konfigurieren.
Cloud-Bereitstellungskonfiguration
Name der Cloud-Bereitstellungskonfiguration, die einer Cloud-Plattform wie Amazon AWS oder Microsoft Azure zugeordnet ist.
Erforderlich, wenn Sie die Cluster-Konfiguration nicht konfigurieren.
Cluster-Umgebungsvariablen*
Umgebungsvariablen, die vom Hadoop-Cluster verwendet werden.
Konfigurieren Sie bei Verwendung eines Cloudera CDH 6.x- oder eines Cloudera CDP-Clusters die Gebietsschemaeinstellung als Cluster-Umgebungsvariablen. In Cloudera Manager müssen Sie darüber hinaus die Umgebungsvariablen zu folgender YARN-Eigenschaft hinzufügen:
yarn.nodemanager.env-whitelist
Die Variable ORACLE_HOME stellt beispielsweise das Verzeichnis dar, in dem die Software des Oracle-Datenbank-Clients installiert ist.
Sie haben die Möglichkeit, Laufzeiteigenschaften für die Hadoop-Umgebung im Datenintegrationsdienst, in der Hadoop-Verbindung und im Mapping zu konfigurieren. Eine auf einer hohen Ebene konfigurierte Eigenschaft können Sie durch Festlegen des Werts auf einer unteren Ebene überschreiben. Wenn Sie z. B. eine Eigenschaft in den benutzerdefinierten Eigenschaften des Datenintegrationsdiensts konfigurieren, können Sie diese in der Hadoop-Verbindung oder im Mapping überschreiben. Der Datenintegrationsdienst verarbeitet Überschreibungen von Eigenschaften auf der Grundlage der folgenden Prioritäten:
  1. Zuordnung der mit dem Befehl
    infacmd ms runMapping
    und der Option
    -cp
    festgelegten benutzerdefinierten Eigenschaften
  2. Zuordnung der Laufzeiteigenschaften für die Hadoop-Umgebung
  3. Erweiterte Eigenschaften der Hadoop-Verbindung für Laufzeit-Engines
  4. Erweiterte allgemeine Eigenschaften, Umgebungsvariablen und Klassenpfade der Hadoop-Verbindung
  5. Benutzerdefinierte Eigenschaften des Datenintegrationsdiensts
Cluster-Bibliothekspfad*
Der Pfad für freigegebene Bibliotheken auf dem Cluster.
Die Variable $DEFAULT_CLUSTER_LIBRARY_PATH enthält eine Liste der Standardverzeichnisse.
Cluster-Klassenpfad*
Der Klassenpfad für den Zugriff auf die Hadoop-JAR-Dateien und die benötigten Bibliotheken.
Die Variable $DEFAULT_CLUSTER_CLASSPATH enthält eine Liste mit Pfaden der Standard-JAR-Dateien und Bibliotheken.
Sie haben die Möglichkeit, Laufzeiteigenschaften für die Hadoop-Umgebung im Datenintegrationsdienst, in der Hadoop-Verbindung und im Mapping zu konfigurieren. Eine auf einer hohen Ebene konfigurierte Eigenschaft können Sie durch Festlegen des Werts auf einer unteren Ebene überschreiben. Wenn Sie z. B. eine Eigenschaft in den benutzerdefinierten Eigenschaften des Datenintegrationsdiensts konfigurieren, können Sie diese in der Hadoop-Verbindung oder im Mapping überschreiben. Der Datenintegrationsdienst verarbeitet Überschreibungen von Eigenschaften auf der Grundlage der folgenden Prioritäten:
  1. Zuordnung der mit dem Befehl
    infacmd ms runMapping
    und der Option
    -cp
    festgelegten benutzerdefinierten Eigenschaften
  2. Zuordnung der Laufzeiteigenschaften für die Hadoop-Umgebung
  3. Erweiterte Eigenschaften der Hadoop-Verbindung für Laufzeit-Engines
  4. Erweiterte allgemeine Eigenschaften, Umgebungsvariablen und Klassenpfade der Hadoop-Verbindung
  5. Benutzerdefinierte Eigenschaften des Datenintegrationsdiensts
Pfad der ausführbaren Datei des Clusters*
Der Pfad für ausführbare Dateien auf dem Cluster.
Die Variable $DEFAULT_CLUSTER_EXEC_PATH enthält eine Liste mit Pfaden der ausführbaren Standarddateien.
* Bevor Sie sich nicht in der Drittanbieter- und Informatica-Dokumentation oder beim globalen Kundensupport von Informatica entsprechend informiert haben, rät Informatica von der Änderung dieser Eigenschaftswerte ab. Wenn Sie einen Wert ohne Kenntnis der Eigenschaft ändern, kann es zu Leistungseinbußen oder anderen unerwarteten Ergebnissen kommen.