Table des matières

Search

  1. Préface
  2. Introduction à l'administration du catalogue
  3. Concepts d'Enterprise Data Catalog
  4. Utilisation de Catalog Administrator
  5. Gestion des ressources
  6. Gestion de la sécurité des ressources
  7. Gestion des planifications
  8. Gestion des attributs
  9. Attribution de connexions
  10. Configuration des paramètres réutilisables
  11. Surveillance d'Enterprise Data Catalog
  12. Gestion des domaines de données
  13. Gestion des domaines de données composites
  14. Gérer les définitions de synonymes
  15. Gestion de l'organisation Cloud
  16. Présentation de l'intégration de métadonnées personnalisées
  17. Utilitaires de sauvegarde de catalogue et de collecte de journaux
  18. Annexe A: Enregistrement de types de données inconnus pour l'exécution de profils
  19. Annexe B: Gestion de l'importation à partir de ServiceNow
  20. Annexe C: Fichier CSV de ressource de lignage personnalisée
  21. Annexe D: Agent Enterprise Data Catalog
  22. Annexe E: Lignage entre les ressources PowerCenter et les fichiers plats
  23. Annexe F: Extraction de métadonnées à partir de ressources inaccessibles et hors ligne
  24. Annexe G: Enterprise Data CatalogModules complémentaires

Guide de Catalog Administrator

Guide de Catalog Administrator

Paramètres d'inférence de clé unique

Paramètres d'inférence de clé unique

Une clé unique est une colonne ou une combinaison de colonnes qui identifie de façon unique une ligne dans une source de données. Le service de profilage identifie les colonnes dans l'objet de données afin de générer des clés uniques. Enterprise Data Catalog affiche des inférences de clé unique pour les actifs tabulaires.
La clé unique ne peut pas contenir de doublons. Si une colonne comprend des doublons, elle n'est pas identifiée en tant que clé unique. L'inférence de clé unique est prise en charge dans l'environnement d'exécution natif.
Dans la section
Paramètres d'inférence de clé unique
, vous pouvez configurer les options suivantes pour une ressource afin qu'elle génère la clé unique :
Exécuter l'inférence de clé unique
Le scanneur de profil analyse et infère les clés uniques de la source de données.
Seuil % Null dans l'inférence de clé unique
Définit le seuil des valeurs Null dans l'inférence de clé unique. Vous pouvez entrer une valeur comprise entre 0 et 1.
Ignorer l'inférence de clé unique lorsqu'une clé unique acceptée ou documentée existe
Ignore la table avec les clés uniques documentées ou acceptées.
Options d'échantillonnage de la clé unique
Vous pouvez choisir les options d'échantillonnage suivantes :
  • Toutes les lignes. Exécute l'inférence de clé unique sur toutes les lignes de l'objet de données.
  • <number> premières lignes. Exécute l'inférence de clé unique sur les lignes sélectionnées dans l'objet de données.
Les ressources suivantes prennent en charge l'inférence de clé unique :
Type de ressource relationnelle
  • Amazon Redshift
  • Hive
  • IBM Netezza
  • Microsoft SQL Server
  • Oracle
  • Scanner avancé de Snowflake
  • Teradata
Ressources basées sur des fichiers
  • Amazon S3
  • ADLS Gen1
  • ADLS Gen 2 V2
  • Azure Blob
  • Système de fichiers
  • HDFS
Types de fichiers
Fichiers CSV
Lorsque vous configurez une ressource non prise en charge pour inférer les clés uniques, le message d'erreur suivant s'affiche :
L'inférence de clé unique n'est pas prise en charge pour le type de ressource : Type de ressource