Préface
Introduction à l'administration du catalogue
- Présentation d'Enterprise Data Catalog
- Architecture Enterprise Unified Metadata
- Présentation de l'administration du catalogue
- Processus d'administration du catalogue
- Accès à Catalog Administrator
Concepts d'Enterprise Data Catalog
- Présentation des concepts d'Enterprise Data Catalog
- Catalogue
- Type de ressource
- Ressource
- Scanner
- Planification
- Exemple d'entreprise
- Domaines de données et groupes de domaines de données
- Domaines de données composites
  - Flux de travail de la découverte de domaines de données composites
- Découverte de données
- Similarité de colonne
- Propagation des termes d'entreprise
- Business Glossary Synchronisation
- Aperçu, préparation et provisionnement des données
Utilisation de Catalog Administrator
- Présentation de Catalog Administrator
- Espace de travail Présentation
- Espace de travail Ressource
- Espace de travail Surveillance
- Espace de travail Bibliothèque
- Espace de travail Domaines de données
Gestion des ressources
- Présentation de la gestion des ressources
- Ressources et scanneurs
- Ressources et planifications
- Ressources et attributs
- Ressources de référence
  - Avantages de l'extraction des actifs de référence
  - Attribuer des connexions aux ressources de référence
  - Exemple de cas d'utilisation
- Affichage des ressources de référence
- Création d'une ressource
- Type de ressource
- Filtre de profil des données et métadonnées source
- Liaison insensible à la casse
- Activation de la découverte de données
- Découverte de domaines de données composites
- Activer l'association des termes d'entreprise
- Activer le provisionnement de données
- Activer la préparation des données
- Modification d'une ressource
- Clonage d'une ressource
- Exécution d'une analyse sur une ressource
- Ressources système
- Affichage d'une ressource
Gestion de la sécurité des ressources
- Présentation de la gestion de la sécurité des ressources
- Configuration des autorisations par défaut pour les ressources
- Configuration des autorisations pour des utilisateurs et des groupes d'utilisateurs spécifiques
- Application de limitations à une ressource
- Attribution des autorisations de configuration aux ressources
Gestion des planifications
- Présentation de la gestion des planifications
- Types de planifications
  - Planifications réutilisables
  - Planifications personnalisées
- Création d'une planification
- Affichage de la liste des planifications
Gestion des attributs
- Présentation de la gestion des attributs
- Attributs système
- Attributs personnalisés
- Propriétés générales des attributs
- Propriétés de la configuration de recherche
- Création d'un attribut personnalisé
- Modification d'un attribut personnalisé et d'un attribut système
- Attribution d'attributs personnalisés aux classes et aux ressources
Attribution de connexions
- Présentation de l'attribution de connexions
- Connexions attribuées automatiquement
- Connexions attribuées par l'utilisateur
- Gestion des connexions
  - Attribution de connexions aux ressources de référence
- Rapport des liens manquants
- Colonnes du rapport des liens manquants
- Génération du rapport des liens manquants
Configuration des paramètres réutilisables
- Présentation de la configuration réutilisable
- Propriétés générales de configuration
- Propriétés de la connexion du service d'intégration de données
- Configuration d'un service d'intégration de données réutilisable
Surveillance d'Enterprise Data Catalog
- Présentation de la surveillance d'Enterprise Data Catalog
- Statuts de tâches
- Distribution des tâches
- Surveillance par ressource
- Surveillance par tâche
- Gestion des tâches
- Application de filtres pour surveiller les tâches
Gestion des domaines de données
- Présentation de la gestion des domaines de données
- Meilleures pratiques pour la création de domaines de données à l'aide de règles
- Création d'un domaine de données basé sur des règles
- Création d'un groupe de domaines de données
- Affichage des domaines de données et des groupes de domaines de données
- Filtrage de domaines de données
- Filtrage de groupes de domaines de données
- Modification d'un domaine de données ou d'un groupe de domaines de données
- Autorisations et privilèges
- Découverte de domaines de données sur le moteur Spark
- Découverte de domaines de données sur le cluster Databricks
Gestion des domaines de données composites
- Présentation de la gestion des domaines de données composites
- Création de domaines de données composites
- Affichage des domaines de données composites existants
- Filtrage des domaines de données composites
- Modification des domaines de données composites existants
- Suppression des domaines de données composites existants
Gérer les définitions de synonymes
- Présentation de la gestion des définitions de synonymes
- Chargement de fichiers de définitions de synonymes
Gestion de l'organisation Cloud
- Présentation de la gestion de l'organisation Cloud
- Propriétés de l'organisation Cloud
  - Ajout d'une organisation Informatica Intelligent Cloud Services
  - Modification de l'organisation Informatica Intelligent Cloud Services
Présentation de l'intégration de métadonnées personnalisées
- Présentation de l'intégration de métadonnées personnalisées
- Flux de travail d'intégration de métadonnées personnalisées
- Téléchargement des fichiers de définition de modèle pour la validation
- Création de modèles personnalisés
- Mise à jour des modèles personnalisés
- Exportation de modèles
- Désapprobation de modèles personnalisés
- Vue d'ensemble du type de ressource personnalisé
  - Ressources ETL personnalisées
- Création de types de ressources personnalisés
- Création de ressources personnalisées
- Aperçu de l'ingestion des métadonnées
- Personnaliser les icônes et configurer les vues de relations pour les ressources personnalisées
- Lignage de contexte pour les ressources personnalisées
  - Structure de fichier CSV de ressource de lignage de contexte
Utilitaires de sauvegarde de catalogue et de collecte de journaux
- Présentation
- Accès aux utilitaires
- Exécution d'une sauvegarde de catalogue
- Utilitaires de collecte de journaux
  - Collecter les journaux de service Enterprise Data Catalog
  - Collecter les journaux de ressource
- untitled-topic
Annexe A: Enregistrement de types de données inconnus pour l'exécution de profils
- Présentation
  - Exemple
- Enregistrement d'un type de données inconnu comme type de données pris en charge
Annexe B: Gestion de l'importation à partir de ServiceNow
- Présentation de la gestion de l'importation à partir de ServiceNow
- Importation de connexions à partir de ServiceNow
Annexe C: Fichier CSV de ressource de lignage personnalisée
- Fichier CSV de ressource de lignage personnalisée
Annexe D: Agent Enterprise Data Catalog
- Installation d'Enterprise Data Catalog Agent
- Installation d'Enterprise Data Catalog Agent en tant que Service Windows
- Configuration d'Enterprise Data Catalog Agent pour SSL
Annexe E: Lignage entre les ressources PowerCenter et les fichiers plats
- Présentation
- Configuration et exécution d'une ressource de fichier plat sur une machine Windows
- Affichage du lignage entre les ressources PowerCenter et les fichiers plats
Annexe F: Extraction de métadonnées à partir de ressources inaccessibles et hors ligne
- Présentation
- Processus
- Composants de l'utilitaire de scanneur
- Prérequis et meilleures pratiques
- Exécution du script de scanneur
- Commande de script
- Structure du fichier d'archive des métadonnées
Annexe G: Enterprise Data CatalogModules complémentaires
- Présentation des modules complémentaires Enterprise Data Catalog
- Déployer les modules complémentaires
- Connectez-vous aux modules complémentaires Enterprise Data Catalog
- Afficher les planifications de ressources et les ressources en double
- Accepter les domaines de données
- Associer des termes d'entreprise à partir du fichier de synonymes

Guide de Catalog Administrator

10.5.3
- 10.5.8
- 10.5.7
- 10.5.6
- 10.5.2
- 10.5.1
- 10.5

Précédent Suivant

Découverte de domaines de données sur le moteur Spark

Lorsque vous exécutez un profil pour effectuer une découverte de données sur le moteur Spark, les tables de référence sont stockées sur le cluster Hadoop. Pour vous assurer que les tables de référence de tous les domaines de données sont stockées sur le cluster, procédez comme suit :

Prérequis :

Vous devez disposer de l'autorisation d'emprunter l'identité de l'utilisateur HDFS lorsque vous effectuez une découverte de domaines de données.

Télécharger les fichiers JAR JDBC

Obtenez les fichiers JAR JDBC de la base de données de référence que vous utilisez. Vous pouvez télécharger les fichiers à partir du site Web du fournisseur de la base de données.

Copiez les fichiers téléchargés à l'emplacement suivant :

<INFA_HOME>/externaljdbcjars

Configurer les propriétés personnalisées sur le service d'intégration de données

Lancez Informatica Administrator, puis sélectionnez

Service d'intégration de données

dans le

Navigateur de domaine

Sous l'onglet

Propriétés

, cliquez sur

Propriétés personnalisées

Définissez les propriétés personnalisées suivantes pour effectuer le stockage intermédiaire des tables de référence pour les domaines de données :

Nom propriété	Valeur propriété
AdvancedProfilingServiceOptions.ProfilingSparkReferenceDataHDFSDir	/tmp/cms
ExecutionContextOptions.SparkRefTableHadoopConnectorArgs	--connect <JDBC thin driver connection URL>

Assurez-vous que le répertoire

/tmp/cms

existe sur le cluster. Si ce n'est pas le cas, créez le répertoire

/tmp/cms

ou un répertoire personnalisé où vous souhaitez stocker les données. Les données de référence sont stockées dans le répertoire

/tmp/cms

par défaut.

Recyclez le service d'intégration de données.

Ouvrez Catalog Administrator et assurez-vous que vous exécutez un premier profil avec tous les domaines de données pour stocker les données de référence de manière intermédiaire.

Si vous ne sélectionnez pas tous les domaines de données lors de l'exécution du premier profil, puis sélectionnez les domaines de données supplémentaires lors de l'exécution de profil suivante, celle-ci peut échouer.

Gestion des domaines de données

Télécharger le guide

Envoyer les commentaires

Communities

Knowledge Base

Portail du succès

Rename Saved Search

Table des matières

Guide de Catalog Administrator

Guide de Catalog Administrator

Découverte de domaines de données sur le moteur Spark

Découverte de domaines de données sur le moteur Spark

Prérequis :

Télécharger les fichiers JAR JDBC

Configurer les propriétés personnalisées sur le service d'intégration de données