Table des matières

Search

  1. Préface
  2. Introduction à l'administration du catalogue
  3. Concepts d'Enterprise Data Catalog
  4. Utilisation de Catalog Administrator
  5. Gestion des ressources
  6. Gestion de la sécurité des ressources
  7. Gestion des planifications
  8. Gestion des attributs
  9. Attribution de connexions
  10. Configuration des paramètres réutilisables
  11. Surveillance d'Enterprise Data Catalog
  12. Gestion des domaines de données
  13. Gestion des domaines de données composites
  14. Gérer les définitions de synonymes
  15. Gestion de l'organisation Cloud
  16. Présentation de l'intégration de métadonnées personnalisées
  17. Utilitaires de sauvegarde de catalogue et de collecte de journaux
  18. Annexe A: Enregistrement de types de données inconnus pour l'exécution de profils
  19. Annexe B: Gestion de l'importation à partir de ServiceNow
  20. Annexe C: Fichier CSV de ressource de lignage personnalisée
  21. Annexe D: Agent Enterprise Data Catalog
  22. Annexe E: Lignage entre les ressources PowerCenter et les fichiers plats
  23. Annexe F: Extraction de métadonnées à partir de ressources inaccessibles et hors ligne
  24. Annexe G: Enterprise Data CatalogModules complémentaires

Guide de Catalog Administrator

Guide de Catalog Administrator

Propagation des termes d'entreprise

Propagation des termes d'entreprise

Enterprise Data Catalog identifie les termes d'entreprise potentiels qui peuvent être associés à des colonnes et des champs du catalogue. Enterprise Data Catalog exécute régulièrement la ressource système
DataDomainPropagation
pour accepter automatiquement ou recommander les termes d'entreprise pour des colonnes similaires. Ce processus limite l'intervention manuelle afin d'identifier et d'associer des termes d'entreprise à des tables, colonnes, vues ou champs.
Dans Enterprise Data Catalog, un terme d'entreprise ayant le score de confiance supérieur à 80 % est automatiquement attribué comme fonction à une ressource. Le score de confiance est calculé par un algorithme interne basé sur les termes d'entreprise acceptés sur les domaines de données, la similarité de colonnes et la correspondance de noms entre une colonne et un terme d'entreprise. S'il existe plusieurs termes d'entreprise avec un seuil supérieur à 80 pour cent, le terme dont le niveau de confiance est le plus élevé est automatiquement attribué comme titre d'entreprise. Enterprise Data Catalog affiche au maximum trois termes d'entreprise recommandés si le niveau de confiance est compris entre 60 et 80 pour cent pour une colonne.
Le processus de propagation de termes d'entreprise implique les étapes suivantes :
  1. Vous configurez et exécutez une ressource
    Vous créez une ressource et configurez les paramètres dans l'onglet
    Paramètres de chargement des métadonnées
    Paramètres de préparation des données du profil de similarité et de fréquence de la valeur
    , puis exécutez la ressource. Parallèlement, avec l'option
    Exécuter le profil de similarité
    , configurez les paramètres dans la section
    Paramètres de chargement des métadonnées
    Association des termes d'entreprise
    , puis exécutez la ressource.
    Vous pouvez choisir de configurer uniquement
    Association des termes d'entreprise
    sans configurer l'option
    Exécuter le profil de similarité
    d'une ressource afin de propager les termes d'entreprise.
    Pour plus d'informations sur la configuration de l'
    Association des termes d'entreprise
    , consultez la rubrique Activer l'association des termes métier.
  2. Vous exécutez une ressource Business Glossary ou Axon
    Vous créez et exécutez une ressource Business Glossary ou Axon pour récupérer et afficher les termes d'entreprise du catalogue.
  3. Vous pouvez créer et exécuter la ressource Informatica Similarity Discovery
    Vous pouvez créer et exécuter la ressource
    Informatica Similarity Discovery
    . La ressource système
    SimilarityDiscovery
    découvre les colonnes similaires selon le nom de colonne, le modèle de données de colonnes et les valeurs uniques dans la ressource.
    Il n'est pas nécessaire de configurer l'option
    Exécuter le profil de similarité
    si vous choisissez de propager les termes d'entreprise uniquement avec l'option
    Association des termes d'entreprise
    .
  4. Enterprise Data Catalog exécute la ressource système DataDomainPropagation
    Enterprise Data Catalog exécute la ressource système
    DataDomainPropagation
    toutes les 120 minutes, conformément à une planification prédéfinie. La ressource système
    DataDomainPropagation
    effectue les tâches suivantes :
    • Le scanneur utilise les colonnes similaires inférées pour propager les domaines de données intelligents à d'autres colonnes similaires.
    • Acceptation automatique ou recommandation des termes d'entreprise pour d'autres colonnes similaires en fonction du score de confiance.
Le scanner accepte automatiquement les termes d'entreprise ou les affiche sous forme de recommandations pour les colonnes lorsque l'une des conditions suivantes est remplie :
  • Un domaine de données contient un terme d'entreprise accepté
  • Une colonne contient un terme d'entreprise accepté
  • Les noms de la colonne et du terme d'entreprise sont similaires