Table des matières

Search

  1. Préface
  2. Introduction à l'administration du catalogue
  3. Concepts d'Enterprise Data Catalog
  4. Utilisation de Catalog Administrator
  5. Gestion des ressources
  6. Gestion de la sécurité des ressources
  7. Gestion des planifications
  8. Gestion des attributs
  9. Attribution de connexions
  10. Configuration des paramètres réutilisables
  11. Surveillance d'Enterprise Data Catalog
  12. Gestion des domaines de données
  13. Gestion des domaines de données composites
  14. Gérer les définitions de synonymes
  15. Gestion de l'organisation Cloud
  16. Présentation de l'intégration de métadonnées personnalisées
  17. Utilitaires de sauvegarde de catalogue et de collecte de journaux
  18. Annexe A: Enregistrement de types de données inconnus pour l'exécution de profils
  19. Annexe B: Gestion de l'importation à partir de ServiceNow
  20. Annexe C: Fichier CSV de ressource de lignage personnalisée
  21. Annexe D: Agent Enterprise Data Catalog
  22. Annexe E: Lignage entre les ressources PowerCenter et les fichiers plats
  23. Annexe F: Extraction de métadonnées à partir de ressources inaccessibles et hors ligne
  24. Annexe G: Enterprise Data CatalogModules complémentaires

Guide de Catalog Administrator

Guide de Catalog Administrator

Découverte de domaines de données sur le moteur Spark

Découverte de domaines de données sur le moteur Spark

Lorsque vous exécutez un profil pour effectuer une découverte de données sur le moteur Spark, les tables de référence sont stockées sur le cluster Hadoop. Pour vous assurer que les tables de référence de tous les domaines de données sont stockées sur le cluster, procédez comme suit :

Prérequis :

Vous devez disposer de l'autorisation d'emprunter l'identité de l'utilisateur HDFS lorsque vous effectuez une découverte de domaines de données.

Télécharger les fichiers JAR JDBC

  1. Obtenez les fichiers JAR JDBC de la base de données de référence que vous utilisez. Vous pouvez télécharger les fichiers à partir du site Web du fournisseur de la base de données.
  2. Copiez les fichiers téléchargés à l'emplacement suivant :
    <INFA_HOME>/externaljdbcjars

Configurer les propriétés personnalisées sur le service d'intégration de données

  1. Lancez Informatica Administrator, puis sélectionnez
    Service d'intégration de données
    dans le
    Navigateur de domaine
    .
  2. Sous l'onglet
    Propriétés
    , cliquez sur
    Propriétés personnalisées
    .
  3. Définissez les propriétés personnalisées suivantes pour effectuer le stockage intermédiaire des tables de référence pour les domaines de données :
    Nom propriété
    Valeur propriété
    AdvancedProfilingServiceOptions.ProfilingSparkReferenceDataHDFSDir
    /tmp/cms
    ExecutionContextOptions.SparkRefTableHadoopConnectorArgs
    --connect <JDBC thin driver connection URL>
  4. Assurez-vous que le répertoire
    /tmp/cms
    existe sur le cluster. Si ce n'est pas le cas, créez le répertoire
    /tmp/cms
    ou un répertoire personnalisé où vous souhaitez stocker les données. Les données de référence sont stockées dans le répertoire
    /tmp/cms
    par défaut.
  5. Recyclez le service d'intégration de données.
  6. Ouvrez Catalog Administrator et assurez-vous que vous exécutez un premier profil avec tous les domaines de données pour stocker les données de référence de manière intermédiaire.
Si vous ne sélectionnez pas tous les domaines de données lors de l'exécution du premier profil, puis sélectionnez les domaines de données supplémentaires lors de l'exécution de profil suivante, celle-ci peut échouer.