Profile und Stichprobenoptionen auf der Spark-Engine
Profile und Stichprobenoptionen auf der Spark-Engine
Ab Version 10.4.0 können Sie Profile ausführen und Stichprobenoptionen für die Spark-Engine wählen.
Profilerstellung auf der Spark-Engine
Sie können Profile auf der Spark-Engine im Informatica Developer Tool und im Informatica Analyst Tool erstellen und ausführen. Sie können die Datendomänenerkennung ausführen und Scorecards auf der Spark-Engine erstellen.
Stichprobenoptionen auf der Spark-Engine
Sie können die folgenden Stichprobenoptionen wählen, um Profile auf der Spark-Engine auszuführen:
Mit der Stichprobenoption
Limit n
wird ein Profil basierend auf der Anzahl der Zeilen im Datenobjekt ausgeführt. Wenn Sie ein Profil in der Hadoop-Umgebung ausführen möchten, sammelt die Spark-Engine Stichproben aus mehreren Partitionen des Datenobjekts und überträgt die Stichproben an einen einzelnen Knoten, um die Stichprobengröße zu berechnen. Sie können die Stichprobenoptionen für „limit n“ nicht auf Profile mit erweitertem Filter anwenden.
Diese Option wird in der Oracle-Datenbank durch eine Sqoop-Verbindung unterstützt.
Mit der Stichprobenoption
Random percentage
wird ein Profil basierend auf dem Prozentsatz der Zeilen im Datenobjekt ausgeführt.
Weitere Informationen zu den Profilen und Stichprobenoptionen auf der Spark-Engine finden Sie im