Préface
Introduction à l'administration du catalogue
- Présentation d'Enterprise Data Catalog
- Architecture Enterprise Unified Metadata
- Présentation de l'administration du catalogue
- Processus d'administration du catalogue
- Accès à Catalog Administrator
Concepts d'Enterprise Data Catalog
- Présentation des concepts d'Enterprise Data Catalog
- Catalogue
- Type de ressource
- Ressource
- Scanner
- Planification
- Exemple d'entreprise
- Domaines de données et groupes de domaines de données
- Domaines de données composites
  - Flux de travail de la découverte de domaines de données composites
- Découverte de données
- Similarité de colonne
- Propagation des termes d'entreprise
- Business Glossary Synchronisation
- Aperçu et provisionnement des données
Utilisation de Catalog Administrator
- Présentation de Catalog Administrator
- Espace de travail Présentation
- Espace de travail Ressource
- Espace de travail Surveillance
- Espace de travail Bibliothèque
- Espace de travail Domaines de données
Gestion des ressources
- Présentation de la gestion des ressources
- Ressources et scanneurs
- Ressources et planifications
- Ressources et attributs
- Ressources de référence
  - Avantages de l'extraction des actifs de référence
  - Attribuer des connexions aux ressources de référence
  - Exemple de cas d'utilisation
- Affichage des ressources de référence
- Création d'une ressource
- Type de ressource
- Filtre de profil de jeu de données ou de schéma
- Filtre de profil des données et métadonnées source
- Liaison insensible à la casse
- Activation de la découverte de données
- Découverte de domaines de données composites
- Activer l'association des termes métier
- Activer le provisionnement de données
- Modification d'une ressource
- Clonage d'une ressource
- Exécution d'une analyse sur une ressource
- Ressources système
- Affichage d'une ressource
Gestion de la sécurité des ressources
- Présentation de la gestion de la sécurité des ressources
- Configuration des autorisations par défaut pour les ressources
- Configuration des autorisations pour des utilisateurs et des groupes d'utilisateurs spécifiques
- Application de limitations à une ressource
- Attribution des autorisations de configuration aux ressources
Gestion des planifications
- Présentation de la gestion des planifications
- Types de planifications
  - Planifications réutilisables
  - Planifications personnalisées
- Création d'une planification
- Affichage de la liste des planifications
Gestion des attributs
- Présentation de la gestion des attributs
- Attributs système
- Attributs personnalisés
- Propriétés générales des attributs
- Propriétés de la configuration de recherche
- Création d'un attribut personnalisé
- Modification d'un attribut personnalisé et d'un attribut système
- Attribution d'attributs personnalisés aux classes et aux ressources
Attribution de connexions
- Présentation de l'attribution de connexions
- Connexions attribuées automatiquement
- Connexions attribuées par l'utilisateur
- Gestion des connexions
  - Attribution de connexions aux ressources de référence
- Rapport des liens manquants
- Colonnes du rapport des liens manquants
- Génération du rapport des liens manquants
Configuration des paramètres réutilisables
- Présentation de la configuration réutilisable
- Propriétés générales de configuration
- Propriétés de la connexion du service d'intégration de données
- Configuration d'un service d'intégration de données réutilisable
Surveillance d'Enterprise Data Catalog
- Présentation de la surveillance d'Enterprise Data Catalog
- Statuts de tâches
- Distribution des tâches
- Surveillance par ressource
- Surveillance par tâche
- Gestion des tâches
- Application de filtres pour surveiller les tâches
Gestion des domaines de données
- Présentation de la gestion des domaines de données
- Meilleures pratiques pour la création de domaines de données à l'aide de règles
- Création d'un domaine de données basé sur des règles
- Création d'un groupe de domaines de données
- Affichage des domaines de données et des groupes de domaines de données
- Filtrage de domaines de données
- Filtrage de groupes de domaines de données
- Modification d'un domaine de données ou d'un groupe de domaines de données
- Autorisations et privilèges
- Découverte de domaines de données sur le moteur Spark
- Découverte de domaines de données sur le cluster Databricks
Gestion des domaines de données composites
- Présentation de la gestion des domaines de données composites
- Création de domaines de données composites
- Affichage des domaines de données composites existants
- Filtrage des domaines de données composites
- Modification des domaines de données composites existants
- Suppression des domaines de données composites existants
Gérer les définitions de synonymes
- Présentation de la gestion des définitions de synonymes
- Validation des fichiers de définitions des synonymes
- Chargement de fichiers de définitions de synonymes
Gestion de l'organisation Cloud
- Présentation de la gestion de l'organisation Cloud
- Propriétés de l'organisation Cloud
  - Ajout d'une organisation Informatica Intelligent Cloud Services
  - Modification de l'organisation Informatica Intelligent Cloud Services
Présentation de l'intégration de métadonnées personnalisées
- Présentation de l'intégration de métadonnées personnalisées
- Flux de travail d'intégration de métadonnées personnalisées
- Téléchargement des fichiers de définition de modèle pour la validation
- Création de modèles personnalisés
- Mise à jour des modèles personnalisés
- Exportation de modèles
- Désapprobation de modèles personnalisés
- Vue d'ensemble du type de ressource personnalisé
  - Ressources ETL personnalisées
- Création de types de ressources personnalisés
- Création de ressources personnalisées
- Aperçu de l'ingestion des métadonnées
- Personnaliser les icônes et configurer les vues de relations pour les ressources personnalisées
- Lignage de contexte pour les ressources personnalisées
  - Structure de fichier CSV de ressource de lignage de contexte
Utilitaires de sauvegarde de catalogue et de collecte de journaux
- Présentation
- Accès aux utilitaires
- Exécution d'une sauvegarde de catalogue
- Utilitaires de collecte de journaux
  - Collecter les journaux de service Enterprise Data Catalog
  - Collecter les journaux de ressource
- untitled-topic
Annexe A: Enregistrement de types de données inconnus pour l'exécution de profils
- Présentation
  - Exemple
- Enregistrement d'un type de données inconnu comme type de données pris en charge
Annexe B: Gestion de l'importation à partir de ServiceNow
- Présentation de la gestion de l'importation à partir de ServiceNow
- Importation de connexions à partir de ServiceNow
Annexe C: Fichier CSV de ressource de lignage personnalisée
- Fichier CSV de ressource de lignage personnalisée
Annexe D: Agent Enterprise Data Catalog
- Installation d'Enterprise Data Catalog Agent
- Installation d'Enterprise Data Catalog Agent en tant que Service Windows
- Configuration d'Enterprise Data Catalog Agent pour SSL
Annexe E: Lignage entre les ressources PowerCenter et les fichiers plats
- Présentation
- Configuration et exécution d'une ressource de fichier plat sur une machine Windows
- Affichage du lignage entre les ressources PowerCenter et les fichiers plats
Annexe F: Extraction de métadonnées à partir de ressources inaccessibles et hors ligne
- Présentation
- Processus
- Composants de l'utilitaire de scanneur
- Prérequis et meilleures pratiques
- Exécution du script de scanneur
- Commande de script
- Structure du fichier d'archive des métadonnées
Annexe G: Enterprise Data CatalogModules complémentaires
- Présentation des modules complémentaires Enterprise Data Catalog
- Déployer les modules complémentaires
- Connectez-vous aux modules complémentaires Enterprise Data Catalog
- Afficher les planifications de ressources et les ressources en double
- Accepter les domaines de données
- Déplacement de domaines de données à l'aide de l'utilitaire Gestionnaire de domaines de données
- Associer des termes d'entreprise à partir du fichier de synonymes
- Migrer des attributs personnalisés

Guide de Catalog Administrator

10.5.7
- 10.5.8
- 10.5.6
- 10.5.3
- 10.5.2
- 10.5.1
- 10.5

Précédent Suivant

Processus de similarité de colonne

Le processus de similarité de colonne comprend la gestion intermédiaire des données, la découverte et l'ingestion des données dans le catalogue.

Le processus de similarité de colonne inclut les tâches suivantes :

Préparation des données: Après avoir configuré les paramètres dans la section
Paramètres de préparation des données du profil de similarité et de fréquence de la valeur
et exécuté la ressource, le scanner de profilage prépare les données dans la ressource pour inférer des colonnes similaires, puis conserve les informations dans PostgreSQL. De la même manière, vous pouvez préparer et conserver des données pour plusieurs ressources.

Découverte de colonnes similaires: Pour identifier les colonnes similaires, créez et exécutez la ressource Informatica Similarity Discovery. La ressource Informatica Similarity Discovery s'exécute sur plusieurs ressources pour découvrir des colonnes similaires dans le catalogue. Lorsque vous exécutez la ressource Informatica Similarity Discovery, elle analyse PostgreSQL, compare les données préparées pour inférer des colonnes similaires et conserve les résultats dans PostgreSQL.; Les administrateurs Informatica peuvent soit installer le serveur de base de données PostgreSQL fourni avec le programme d'installation d'Enterprise Data Catalog, soit configurer une base de données PostgreSQL externe après l'installation. Les administrateurs Informatica peuvent configurer une base de données PostgreSQL externe si vous exécutez la ressource Informatica Similarity Discovery. Pour plus d'informations sur la manière dont les administrateurs Informatica peuvent configurer une base de données PostgreSQL externe, reportez-vous à l'article https://knowledge.informatica.com/s/article/You-can-t-create-logical-partitions-or-configure-high-availability-and-failover-options-when-you-use-the-PostgreSQL-database-bundled-with-the-Enterprise-Data-Catalog-installer?language=en_US de la base de connaissances (KB).

L'image suivante illustre le processus de similarité de colonne :

Dans Catalog Administrator, vous pouvez activer la découverte de données et configurer les propriétés de la ressource afin de découvrir la similarité de colonne pour plusieurs ressources. Après avoir exécuté les ressources et la ressource Informatica Similarity Discovery dans Catalog Administrator, vous pouvez afficher des colonnes similaires selon les noms de colonnes, les modèles de données de colonnes et les valeurs uniques pour les actifs de données dans Enterprise Data Catalog.

Similarité de colonne

Télécharger le guide

Envoyer les commentaires

Communities

Knowledge Base

Portail du succès

Rename Saved Search

Table des matières

Guide de Catalog Administrator

Guide de Catalog Administrator

Processus de similarité de colonne

Processus de similarité de colonne