Découverte de domaines de données sur le cluster Databricks
Découverte de domaines de données sur le cluster Databricks
Utilisez le cluster Databricks pour effectuer la découverte de données sur le moteur Spark. Le cluster Databricks est un environnement d'exécution des travaux Spark. Vous pouvez exécuter un profil pour effectuer la découverte de données pour les sources Azure à l'aide du cluster Databricks.
Vous devez effectuer les étapes suivantes pour vous connecter aux sources Azure dans le cluster Databricks :
Prérequis
Ajoutez les paramètres de configuration Spark avancés suivants pour le cluster Databricks et redémarrez le cluster :
Si vous utilisez Azure comme cluster Databricks et exécutez le profil sur une ressource Microsoft Azure Data Lake Store, ajoutez le paramètre de configuration Spark avancé suivant pour le cluster Databricks et redémarrez le cluster :
Télécharger et copier les fichiers JAR pour l'entrepôt de profilage
Obtenez les fichiers JAR du pilote JDBC Oracle DataDirect pour l'entrepôt de profilage. Vous pouvez copier les fichiers à partir de l'emplacement suivant :