Table des matières

Search

  1. Préface
  2. Introduction à l'administration du catalogue
  3. Concepts d'Enterprise Data Catalog
  4. Utilisation de Catalog Administrator
  5. Gestion des ressources
  6. Gestion de la sécurité des ressources
  7. Gestion des planifications
  8. Gestion des attributs
  9. Attribution de connexions
  10. Configuration des paramètres réutilisables
  11. Surveillance d'Enterprise Data Catalog
  12. Gestion des domaines de données
  13. Gestion des domaines de données composites
  14. Gérer les définitions de synonymes
  15. Gestion de l'organisation Cloud
  16. Présentation de l'intégration de métadonnées personnalisées
  17. Utilitaires de sauvegarde de catalogue et de collecte de journaux
  18. Annexe A: Enregistrement de types de données inconnus pour l'exécution de profils
  19. Annexe B: Gestion de l'importation à partir de ServiceNow
  20. Annexe C: Fichier CSV de ressource de lignage personnalisée
  21. Annexe D: Agent Enterprise Data Catalog
  22. Annexe E: Lignage entre les ressources PowerCenter et les fichiers plats
  23. Annexe F: Extraction de métadonnées à partir de ressources inaccessibles et hors ligne

Guide de Catalog Administrator

Guide de Catalog Administrator

Exemple d'entreprise

Exemple d'entreprise

Vous êtes administrateur de catalogue dans une organisation multinationale de vente au détail. Les analystes de données de votre service doivent afficher les métadonnées de différents schémas et tables de base de données dans plusieurs sources pour effectuer une analyse de données avancée. Vous devez également vous assurer que les analystes de données comprennent et approuvent les données qu'ils utilisent. L'organisation peut planifier des audits de sécurité réguliers pour trouver des données sensibles dans les sources de données et les masquer ou les protéger selon les besoins.
L'organisation de vente au détail pour laquelle vous travaillez dispose des systèmes configurés suivants :
  • Système de gestion des ressources humaines mis en place sur une base de données Oracle.
  • Système de gestion des commandes mis en place sur la même base de données Oracle.
  • Entrepôt de données hébergé sur un référentiel Hadoop. L'entrepôt de données a intégré des informations provenant de plusieurs sources de données.
  • PowerCenter pour effectuer des tâches d'intégration de données entre des bases de données et des schémas.
  • Système de rapports configuré sur une source SAP BusinessObjects.
L'administrateur de l'organisation peut effectuer les tâches suivantes dans Catalog Administrator pour répondre efficacement aux besoins de l'administration de données dans cet exemple :
  • Utiliser Catalog Administrator pour créer une ressource Oracle pour le système de gestion des ressources humaines et une autre ressource Oracle pour le système de gestion des commandes. Vous pouvez configurer les paramètres de métadonnées source pour extraire les métadonnées dans le catalogue. Il se peut que vous n'ayez pas besoin de configurer les paramètres de métadonnées de profilage pour ces ressources. Les ressources fournissent la table de base de données et les objets de colonne source requis dans le catalogue pour analyse.
  • Créer une ressource Hive pour l'entrepôt Hadoop. La ressource Hive récupère les tables et les colonnes dans le catalogue. En plus de l'extraction des métadonnées source, vous pouvez configurer les paramètres de métadonnées de profilage afin d'avoir des informations relatives à la qualité des données pour une analyse plus poussée.
  • Créer une ressource PowerCenter qui correspond aux exigences d'intégration de données. La configuration des ressources fournit les liens entre les objets de données Oracle et les objets Hive.
  • Créer une ressource de SAP BusinessObjects et la configurer pour extraire des métadonnées de rapport. La ressource fournit des métadonnées de rapport basées sur les liens entre les objets d'entreprise et les objets Oracle et Hive.
  • Définir une planification récurrente pour chaque ressource afin que les scanneurs extraient les métadonnées source et de profilage des systèmes source à intervalles réguliers.
  • Vérifier périodiquement dans Catalog Administrator les tâches qui extraient les métadonnées. Surveillez les tâches afin d'obtenir une vue fonctionnelle d'Enterprise Data Catalog. La surveillance vous permet également d'analyser et d'estimer le type de contenu que les scanners récupèrent dans le catalogue.