Préface
Introduction à l'administration du catalogue
- Présentation d'Enterprise Data Catalog
- Architecture Enterprise Unified Metadata
- Présentation de l'administration du catalogue
- Processus d'administration du catalogue
- Accès à Catalog Administrator
Concepts d'Enterprise Data Catalog
- Présentation des concepts d'Enterprise Data Catalog
- Catalogue
- Type de ressource
- Ressource
- Scanner
- Planification
- Exemple d'entreprise
- Domaines de données et groupes de domaines de données
- Domaines de données composites
  - Flux de travail de la découverte de domaines de données composites
- Découverte de données
- Similarité de colonne
- Propagation des termes d'entreprise
- Business Glossary Synchronisation
- Aperçu et provisionnement des données
Utilisation de Catalog Administrator
- Présentation de Catalog Administrator
- Espace de travail Présentation
- Espace de travail Ressource
- Espace de travail Surveillance
- Espace de travail Bibliothèque
- Espace de travail Domaines de données
Gestion des ressources
- Présentation de la gestion des ressources
- Ressources et scanneurs
- Ressources et planifications
- Ressources et attributs
- Ressources de référence
  - Avantages de l'extraction des actifs de référence
  - Attribuer des connexions aux ressources de référence
  - Exemple de cas d'utilisation
- Affichage des ressources de référence
- Création d'une ressource
- Type de ressource
- Filtre de profil de jeu de données ou de schéma
- Filtre de profil des données et métadonnées sources
- Liaison insensible à la casse
- Activation de la découverte de données
- Découverte de domaines de données composites
- Activer l'association des termes métier
- Activer le provisionnement de données
- Modification d'une ressource
- Clonage d'une ressource
- Exécution d'une analyse sur une ressource
- Ressources système
- Affichage d'une ressource
Gestion de la sécurité des ressources
- Présentation de la gestion de la sécurité des ressources
- Configuration des autorisations par défaut pour les ressources
- Configuration des autorisations pour des utilisateurs et des groupes d'utilisateurs spécifiques
- Application de limitations à une ressource
- Attribution des autorisations de configuration aux ressources
Gestion des planifications
- Présentation de la gestion des planifications
- Types de planifications
  - Planifications réutilisables
  - Planifications personnalisées
- Création d'une planification
- Affichage de la liste des planifications
Gestion des attributs
- Présentation de la gestion des attributs
- Attributs système
- Attributs personnalisés
- Propriétés générales des attributs
- Propriétés de la configuration de recherche
- Création d'un attribut personnalisé
- Modification d'un attribut personnalisé et d'un attribut système
- Attribution d'attributs personnalisés aux classes et aux ressources
Attribution de connexions
- Présentation de l'attribution de connexions
- Connexions attribuées automatiquement
- Connexions attribuées par l'utilisateur
- Gestion des connexions
  - Attribution de connexions aux ressources de référence
- Rapport des liens manquants
- Colonnes du rapport des liens manquants
- Génération du rapport des liens manquants
Configuration des paramètres réutilisables
- Présentation de la configuration réutilisable
- Propriétés générales de configuration
- Propriétés de la connexion du service d'intégration de données
- Configuration d'un service d'intégration de données réutilisable
Surveillance d'Enterprise Data Catalog
- Présentation de la surveillance d'Enterprise Data Catalog
- Statuts de tâches
- Distribution des tâches
- Surveillance par ressource
- Surveillance par tâche
- Gestion des tâches
- Application de filtres pour surveiller les tâches
Gestion des domaines de données
- Présentation de la gestion des domaines de données
- Meilleures pratiques pour la création de domaines de données à l'aide de règles
- Création d'un domaine de données basé sur des règles
- Création d'un groupe de domaines de données
- Affichage des domaines de données et des groupes de domaines de données
- Filtrage de domaines de données
- Filtrage de groupes de domaines de données
- Modification d'un domaine de données ou d'un groupe de domaines de données
- Autorisations et privilèges
- Découverte de domaines de données sur le moteur Spark
- Découverte de domaines de données sur le cluster Databricks
Gestion des domaines de données composites
- Présentation de la gestion des domaines de données composites
- Création de domaines de données composites
- Affichage des domaines de données composites existants
- Filtrage des domaines de données composites
- Modification des domaines de données composites existants
- Suppression des domaines de données composites existants
Gérer les définitions de synonymes
- Présentation de la gestion des définitions de synonymes
- Validation des fichiers de définitions des synonymes
- Chargement de fichiers de définitions de synonymes
Gestion de l'organisation Cloud
- Présentation de la gestion de l'organisation Cloud
- Propriétés de l'organisation Cloud
  - Ajout d'une organisation Informatica Intelligent Cloud Services
  - Modification de l'organisation Informatica Intelligent Cloud Services
Présentation de l'intégration de métadonnées personnalisées
- Présentation de l'intégration de métadonnées personnalisées
- Flux de travail d'intégration de métadonnées personnalisées
- Téléchargement des fichiers de définition de modèle pour la validation
- Création de modèles personnalisés
- Mise à jour des modèles personnalisés
- Exportation de modèles
- Désapprobation de modèles personnalisés
- Vue d'ensemble du type de ressource personnalisé
  - Ressources ETL personnalisées
- Création de types de ressources personnalisés
- Création de ressources personnalisées
- Aperçu de l'ingestion des métadonnées
- Personnaliser les icônes et configurer les vues de relations pour les ressources personnalisées
- Lignage de contexte pour les ressources personnalisées
  - Structure de fichier CSV de ressource de lignage de contexte
Utilitaires de sauvegarde de catalogue et de collecte de journaux
- Présentation
- Accès aux utilitaires
- Exécution d'une sauvegarde de catalogue
- Utilitaires de collecte de journaux
  - Collecter les journaux de service Enterprise Data Catalog
  - Collecter les journaux de ressource
- untitled-topic
Annexe A: Enregistrement de types de données inconnus pour l'exécution de profils
- Présentation
  - Exemple
- Enregistrement d'un type de données inconnu comme type de données pris en charge
Annexe B: Gestion de l'importation à partir de ServiceNow
- Présentation de la gestion de l'importation à partir de ServiceNow
- Importation de connexions à partir de ServiceNow
Annexe C: Fichier CSV de ressource de lignage personnalisée
- Fichier CSV de ressource de lignage personnalisée
Annexe D: Agent Enterprise Data Catalog
- Installation d'Enterprise Data Catalog Agent
- Installation d'Enterprise Data Catalog Agent en tant que Service Windows
- Configuration d'Enterprise Data Catalog Agent pour SSL
Annexe E: Lignage entre les ressources PowerCenter et les fichiers plats
- Présentation
- Configuration et exécution d'une ressource de fichier plat sur une machine Windows
- Affichage du lignage entre les ressources PowerCenter et les fichiers plats
Annexe F: Extraction de métadonnées à partir de ressources inaccessibles et hors ligne
- Présentation
- Processus
- Composants de l'utilitaire de scanneur
- Prérequis et meilleures pratiques
- Exécution du script de scanneur
- Commande de script
- Structure du fichier d'archive des métadonnées
Annexe G: Enterprise Data CatalogModules complémentaires
- Présentation des modules complémentaires Enterprise Data Catalog
- Déployer les modules complémentaires
- Connectez-vous aux modules complémentaires Enterprise Data Catalog
- Afficher les planifications de ressources et les ressources en double
- Accepter les domaines de données
- Déplacement de domaines de données à l'aide de l'utilitaire Gestionnaire de domaines de données
- Associer des termes d'entreprise à partir du fichier de synonymes
- Migrer des attributs personnalisés

Guide de Catalog Administrator

10.5.8
- 10.5.7
- 10.5.6
- 10.5.3
- 10.5.2
- 10.5.1
- 10.5

Précédent Suivant

Similarité de colonne

En tant qu'analyste de données ou architecte de données, vous pouvez numériser vos données d'entreprise pour trouver des colonnes similaires. Lorsque vous exécutez le scanneur de propagation de domaine de données ou lorsque le scanneur est exécuté en fonction d'une planification, il utilise les colonnes similaires déduites pour propager les domaines de données intelligents à d'autres colonnes similaires. Ce processus vous permet de rechercher et de découvrir plus rapidement des ressources intéressantes dans le catalogue.

Dans Catalog Administrator, lorsque vous exécutez une ressource après avoir choisi l'option

Exécuter le profil de similarité

, puis que vous créez et exécutez la ressource

SimilarityDiscovery

, le scanner découvre des colonnes similaires selon les facteurs suivants : nom de colonne, modèle de données de colonnes et valeurs uniques.

Par défaut, Enterprise Data Catalog utilise tous les facteurs pour propager les domaines de données intelligents à d'autres colonnes similaires. Vous pouvez choisir un ou plusieurs facteurs pour propager les domaines de données intelligents à d'autres colonnes similaires. Par exemple, identifiez une colonne ID d'employé comme domaine de données potentiel. Créez un domaine de données intelligent pour la colonne. Pour propager cela à d'autres colonnes similaires, vous ne pouvez choisir que les facteurs de correspondance de noms et de correspondance de modèles.

Vous pouvez identifier la fréquence des valeurs après avoir activé la similarité de colonne pour une ressource et choisi l'option Enregistrer les données source. En fonction de vos besoins professionnels, vous pouvez utiliser la fréquence de la valeur pour analyser les données d'une ressource. Vous pouvez calculer la fréquence de la valeur dans la colonne vue, la colonne de table, le champ CSV, le champ fichier XML et le champ fichier JSON pour les sources relationnelles, les sources semi-structurées et les sources sur lesquelles vous pouvez exécuter le profil de colonne.

Concepts d'Enterprise Data Catalog

Mode de fonctionnement de la similarité de colonne

Processus de similarité de colonne

Choix des facteurs de propagation des domaines de données intelligents

Exemple d'entreprise

Télécharger le guide

Envoyer les commentaires

Communities

Knowledge Base

Portail du succès