Table des matières

Search

  1. Préface
  2. Introduction à l'administration du catalogue
  3. Concepts d'Enterprise Data Catalog
  4. Utilisation de Catalog Administrator
  5. Gestion des ressources
  6. Gestion de la sécurité des ressources
  7. Gestion des planifications
  8. Gestion des attributs
  9. Attribution de connexions
  10. Configuration des paramètres réutilisables
  11. Surveillance d'Enterprise Data Catalog
  12. Gestion des domaines de données
  13. Gestion des domaines de données composites
  14. Gérer les définitions de synonymes
  15. Gestion de l'organisation Cloud
  16. Présentation de l'intégration de métadonnées personnalisées
  17. Utilitaires de sauvegarde de catalogue et de collecte de journaux
  18. Annexe A: Enregistrement de types de données inconnus pour l'exécution de profils
  19. Annexe B: Gestion de l'importation à partir de ServiceNow
  20. Annexe C: Fichier CSV de ressource de lignage personnalisée
  21. Annexe D: Agent Enterprise Data Catalog
  22. Annexe E: Lignage entre les ressources PowerCenter et les fichiers plats
  23. Annexe F: Extraction de métadonnées à partir de ressources inaccessibles et hors ligne
  24. Annexe G: Enterprise Data CatalogModules complémentaires

Guide de Catalog Administrator

Guide de Catalog Administrator

Activer l'association des termes d'entreprise

Activer l'association des termes d'entreprise

Configurez les paramètres d'
Association des termes d'entreprise
d'une ressource afin d'associer automatiquement ou de recommander les termes d'entreprise en tant que fonction pour les tables, les colonnes, les vues, les fichiers et les ressources de champ.
Si vous choisissez l'option
Paramètres de chargement des métadonnées
Association des termes d'entreprise
Activer l'association des termes d'entreprise
afin de configurer la propagation des termes d'entreprise, vous ne devez pas configurer l'option
Exécuter le profil de similarité
d'une ressource afin d'accepter automatiquement ou de recommander le terme d'entreprise pour des colonnes ou des ressources de champ. Configurez les options
Exécuter le profil de similarité
et
Activer l'association des termes d'entreprise
d'une ressource pour améliorer le score de confiance de la propagation des termes d'entreprise.
Enterprise Data Catalog prend en charge l'option
Activer l'association des termes d'entreprise
pour les ressources suivantes :
  • Amazon S3
  • Amazon Redshift
  • Azure Data Lake Store
  • Microsoft Azure SQL Data Warehouse
  • Microsoft Azure SQL Server
  • Système de fichiers
  • Google BigQuery
  • HDFS
  • Hive
  • IBM DB2 for z/OS
  • IBM DB2
  • IBM Netezza
  • JDBC
  • Microsoft Azure Blob Storage
  • Microsoft SQL Server
  • OneDrive
  • Oracle
  • Salesforce
  • SAP
  • SharePoint
  • Snowflake
  • Sybase
  • Teradata
  • Workday
  • MongoDB
Après avoir configuré les paramètres d'association des termes d'entreprise, exécutez la ressource système DataDomainPropagation pour afficher les recommandations de termes d'entreprise immédiatement dans l'application Enterprise Data Catalog.
Configurez les propriétés suivantes dans la section
Association des termes d'entreprise
de la page
Paramètres de chargement des métadonnées
pour associer automatiquement les termes d'entreprise :
Propriété
Description
Activer l'association des termes d'entreprise
Active l'association des termes d'entreprise pour les colonnes et champs dans la ressource.
Sélectionner des glossaires
Sélectionnez les glossaires d'entreprise ou les glossaires Axon à partir desquels vous voulez qu'Enterprise Data Catalog associe automatiquement la fonction aux ressources.
Utiliser des synonymes et des mots vides
Sélectionnez cette option pour utiliser des synonymes et des mots vides lors du processus de propagation des termes d'entreprise. « the », « a », « an » et « in » sont des exemples de mots vides.
Par exemple, supposez une ressource qui contient une colonne nommée
Rapport de profits et pertes
. Le mot
« and »
est un mot vide, et vous voulez qu'Enterprise Data Catalog attribue ou recommande le terme d'entreprise nommé
ProfitLossReport
pour la colonne. Après avoir sélectionné l'option
Utiliser des synonymes et des mots vides
, Enterprise Data Catalog évite le mot vide
« and »
dans le nom de la colonne, puis attribue ou recommande le terme d'entreprise
ProfitLossReport
pour la colonne.
Chargez la liste de définitions des synonymes dans Catalog Administrator pour qu'Enterprise Data Catalog utilise des synonymes afin de propager les termes d'entreprise.
Par exemple, Enterprise Data Catalog contient un terme d'entreprise nommé
Numéro de sécurité sociale
et une colonne nommée
NSS
. Vous voulez que le catalogue associe automatiquement ou recommande le terme d'entreprise
Numéro de sécurité sociale
pour la colonne
NSS
. Après avoir défini la liste de définitions de synonymes dans Catalog Administrator, Enterprise Data Catalog recommande ou attribue
Numéro de sécurité sociale
comme fonction à la colonne.
Pour plus d'informations sur les définitions de synonymes, consultez la section Gérer les définitions de synonymes.
Éviter les préfixes
Sélectionnez cette option pour éviter des préfixes dans le nom de la ressource lors du processus de propagation des termes d'entreprise.
Par exemple, supposez une ressource qui contient une colonne nommée
Reorderdetails
. Vous voulez qu'Enterprise Data Catalog recommande ou attribue automatiquement le terme d'entreprise
orderdetails
. Après avoir sélectionné l'option
Éviter les préfixes
, Enterprise Data Catalog ignore le préfixe
Re
dans le nom de la colonne, puis attribue automatiquement le terme d'entreprise
orderdetails
à la colonne
Reorderdetails
.
Options personnalisées
Paramètres que vous pouvez définir pour configurer la propagation des termes d'entreprise. Utilisez les options personnalisées de pondération de fonctionnalité pour personnaliser la priorité des domaines de données, la similarité de colonnes et les conditions de correspondance de noms lors du processus de propagation des termes d'entreprise. Utilisez les options personnalisées de seuil pour personnaliser la limite de seuil pour les associations et les recommandations automatiques de termes d'entreprise. Selon la limite de seuil que vous définissez, Enterprise Data Catalog attribue des termes d'entreprise ou recommande des termes d'entreprise aux actifs.
Pour configurer la pondération de la fonctionnalité, ajoutez les options personnalisées suivantes à la ressource de propagation des termes d'entreprise :
  • -Dglossary.propagation.domain.curation.feature.weight=<value>
    • La valeur par défaut est 3.
  • -Dglossary.propagation.column.similarity.feature.weight=<value>
    • La valeur par défaut est 1.
Pour configurer les seuils, ajoutez les options personnalisées suivantes à la ressource de propagation des termes d'entreprise :
  • - Dglossary.propagation.autoaccept.score.threshold=<value>
    • La valeur par défaut est 80.
  • - Dglossary.propagation.inference.score.threshold=<value>
    • La valeur par défaut est 60.
Pour plus d'informations sur la propagation des termes d'entreprise, consultez la rubrique Propagation des termes d'entreprise.