Inhaltsverzeichnis

Search

  1. Vorwort
  2. Teil 1: Version 10.4.1
  3. Teil 2: Version 10.4.0
  4. Teil 3: Version 10.2.2
  5. Teil 4: Version 10.2.1
  6. Teil 5: Version 10.2
  7. Teil 6: Version 10.1.1
  8. Teil 7: Version 10.1

Versionshandbuch (10.4.1.2)

Versionshandbuch (10.4.1.2)

Profile und Stichprobenoptionen auf der Spark-Engine

Profile und Stichprobenoptionen auf der Spark-Engine

Ab Version 10.4.0 können Sie Profile ausführen und Stichprobenoptionen für die Spark-Engine wählen.
Profilerstellung auf der Spark-Engine
Sie können Profile auf der Spark-Engine im Informatica Developer Tool und im Informatica Analyst Tool erstellen und ausführen. Sie können die Datendomänenerkennung ausführen und Scorecards auf der Spark-Engine erstellen.
Stichprobenoptionen auf der Spark-Engine
Sie können die folgenden Stichprobenoptionen wählen, um Profile auf der Spark-Engine auszuführen:
  • Mit der Stichprobenoption
    Limit n
    wird ein Profil basierend auf der Anzahl der Zeilen im Datenobjekt ausgeführt. Wenn Sie ein Profil in der Hadoop-Umgebung ausführen möchten, sammelt die Spark-Engine Stichproben aus mehreren Partitionen des Datenobjekts und überträgt die Stichproben an einen einzelnen Knoten, um die Stichprobengröße zu berechnen. Sie können die Stichprobenoptionen für „limit n“ nicht auf Profile mit erweitertem Filter anwenden.
    Diese Option wird in der Oracle-Datenbank durch eine Sqoop-Verbindung unterstützt.
  • Mit der Stichprobenoption
    Random percentage
    wird ein Profil basierend auf dem Prozentsatz der Zeilen im Datenobjekt ausgeführt.
Weitere Informationen zu den Profilen und Stichprobenoptionen auf der Spark-Engine finden Sie im
Informatica 10.4.0 Data Discovery-Handbuch
.