Préface
Introduction à l'administration du catalogue
- Présentation d'Enterprise Data Catalog
- Architecture Enterprise Unified Metadata
- Présentation de l'administration du catalogue
- Processus d'administration du catalogue
- Accès à Catalog Administrator
Concepts d'Enterprise Data Catalog
- Présentation des concepts d'Enterprise Data Catalog
- Catalogue
- Type de ressource
- Ressource
- Scanner
- Planification
- Exemple d'entreprise
- Domaines de données et groupes de domaines de données
- Domaines de données composites
  - Flux de travail de la découverte de domaines de données composites
- Découverte de données
- Similarité de colonne
- Propagation des termes d'entreprise
- Business Glossary Synchronisation
- Aperçu et provisionnement des données
Utilisation de Catalog Administrator
- Présentation de Catalog Administrator
- Espace de travail Présentation
- Espace de travail Ressource
- Espace de travail Surveillance
- Espace de travail Bibliothèque
- Espace de travail Domaines de données
Gestion des ressources
- Présentation de la gestion des ressources
- Ressources et scanneurs
- Ressources et planifications
- Ressources et attributs
- Ressources de référence
  - Avantages de l'extraction des actifs de référence
  - Attribuer des connexions aux ressources de référence
  - Exemple de cas d'utilisation
- Affichage des ressources de référence
- Création d'une ressource
- Type de ressource
- Filtre de profil de jeu de données ou de schéma
- Filtre de profil des données et métadonnées sources
- Liaison insensible à la casse
- Activation de la découverte de données
- Découverte de domaines de données composites
- Activer l'association des termes métier
- Activer le provisionnement de données
- Modification d'une ressource
- Clonage d'une ressource
- Exécution d'une analyse sur une ressource
- Ressources système
- Affichage d'une ressource
Gestion de la sécurité des ressources
- Présentation de la gestion de la sécurité des ressources
- Configuration des autorisations par défaut pour les ressources
- Configuration des autorisations pour des utilisateurs et des groupes d'utilisateurs spécifiques
- Application de limitations à une ressource
- Attribution des autorisations de configuration aux ressources
Gestion des planifications
- Présentation de la gestion des planifications
- Types de planifications
  - Planifications réutilisables
  - Planifications personnalisées
- Création d'une planification
- Affichage de la liste des planifications
Gestion des attributs
- Présentation de la gestion des attributs
- Attributs système
- Attributs personnalisés
- Propriétés générales des attributs
- Propriétés de la configuration de recherche
- Création d'un attribut personnalisé
- Modification d'un attribut personnalisé et d'un attribut système
- Attribution d'attributs personnalisés aux classes et aux ressources
Attribution de connexions
- Présentation de l'attribution de connexions
- Connexions attribuées automatiquement
- Connexions attribuées par l'utilisateur
- Gestion des connexions
  - Attribution de connexions aux ressources de référence
- Rapport des liens manquants
- Colonnes du rapport des liens manquants
- Génération du rapport des liens manquants
Configuration des paramètres réutilisables
- Présentation de la configuration réutilisable
- Propriétés générales de configuration
- Propriétés de la connexion du service d'intégration de données
- Configuration d'un service d'intégration de données réutilisable
Surveillance d'Enterprise Data Catalog
- Présentation de la surveillance d'Enterprise Data Catalog
- Statuts de tâches
- Distribution des tâches
- Surveillance par ressource
- Surveillance par tâche
- Gestion des tâches
- Application de filtres pour surveiller les tâches
Gestion des domaines de données
- Présentation de la gestion des domaines de données
- Meilleures pratiques pour la création de domaines de données à l'aide de règles
- Création d'un domaine de données basé sur des règles
- Création d'un groupe de domaines de données
- Affichage des domaines de données et des groupes de domaines de données
- Filtrage de domaines de données
- Filtrage de groupes de domaines de données
- Modification d'un domaine de données ou d'un groupe de domaines de données
- Autorisations et privilèges
- Découverte de domaines de données sur le moteur Spark
- Découverte de domaines de données sur le cluster Databricks
Gestion des domaines de données composites
- Présentation de la gestion des domaines de données composites
- Création de domaines de données composites
- Affichage des domaines de données composites existants
- Filtrage des domaines de données composites
- Modification des domaines de données composites existants
- Suppression des domaines de données composites existants
Gérer les définitions de synonymes
- Présentation de la gestion des définitions de synonymes
- Validation des fichiers de définitions des synonymes
- Chargement de fichiers de définitions de synonymes
Gestion de l'organisation Cloud
- Présentation de la gestion de l'organisation Cloud
- Propriétés de l'organisation Cloud
  - Ajout d'une organisation Informatica Intelligent Cloud Services
  - Modification de l'organisation Informatica Intelligent Cloud Services
Présentation de l'intégration de métadonnées personnalisées
- Présentation de l'intégration de métadonnées personnalisées
- Flux de travail d'intégration de métadonnées personnalisées
- Téléchargement des fichiers de définition de modèle pour la validation
- Création de modèles personnalisés
- Mise à jour des modèles personnalisés
- Exportation de modèles
- Désapprobation de modèles personnalisés
- Vue d'ensemble du type de ressource personnalisé
  - Ressources ETL personnalisées
- Création de types de ressources personnalisés
- Création de ressources personnalisées
- Aperçu de l'ingestion des métadonnées
- Personnaliser les icônes et configurer les vues de relations pour les ressources personnalisées
- Lignage de contexte pour les ressources personnalisées
  - Structure de fichier CSV de ressource de lignage de contexte
Utilitaires de sauvegarde de catalogue et de collecte de journaux
- Présentation
- Accès aux utilitaires
- Exécution d'une sauvegarde de catalogue
- Utilitaires de collecte de journaux
  - Collecter les journaux de service Enterprise Data Catalog
  - Collecter les journaux de ressource
- untitled-topic
Annexe A: Enregistrement de types de données inconnus pour l'exécution de profils
- Présentation
  - Exemple
- Enregistrement d'un type de données inconnu comme type de données pris en charge
Annexe B: Gestion de l'importation à partir de ServiceNow
- Présentation de la gestion de l'importation à partir de ServiceNow
- Importation de connexions à partir de ServiceNow
Annexe C: Fichier CSV de ressource de lignage personnalisée
- Fichier CSV de ressource de lignage personnalisée
Annexe D: Agent Enterprise Data Catalog
- Installation d'Enterprise Data Catalog Agent
- Installation d'Enterprise Data Catalog Agent en tant que Service Windows
- Configuration d'Enterprise Data Catalog Agent pour SSL
Annexe E: Lignage entre les ressources PowerCenter et les fichiers plats
- Présentation
- Configuration et exécution d'une ressource de fichier plat sur une machine Windows
- Affichage du lignage entre les ressources PowerCenter et les fichiers plats
Annexe F: Extraction de métadonnées à partir de ressources inaccessibles et hors ligne
- Présentation
- Processus
- Composants de l'utilitaire de scanneur
- Prérequis et meilleures pratiques
- Exécution du script de scanneur
- Commande de script
- Structure du fichier d'archive des métadonnées
Annexe G: Enterprise Data CatalogModules complémentaires
- Présentation des modules complémentaires Enterprise Data Catalog
- Déployer les modules complémentaires
- Connectez-vous aux modules complémentaires Enterprise Data Catalog
- Afficher les planifications de ressources et les ressources en double
- Accepter les domaines de données
- Déplacement de domaines de données à l'aide de l'utilitaire Gestionnaire de domaines de données
- Associer des termes d'entreprise à partir du fichier de synonymes
- Migrer des attributs personnalisés

Guide de Catalog Administrator

10.5.8
- 10.5.7
- 10.5.6
- 10.5.3
- 10.5.2
- 10.5.1
- 10.5

Précédent Suivant

Découverte de domaines de données sur le cluster Databricks

Utilisez le cluster Databricks pour effectuer la découverte de données sur le moteur Spark. Le cluster Databricks est un environnement d'exécution des travaux Spark. Vous pouvez exécuter un profil pour effectuer la découverte de données pour les sources Azure à l'aide du cluster Databricks.

Vous devez effectuer les étapes suivantes pour vous connecter aux sources Azure dans le cluster Databricks :

Prérequis

Ajoutez les paramètres de configuration Spark avancés suivants pour le cluster Databricks et redémarrez le cluster :

fs.azure.account.auth.type OAuth

fs.azure.account.oauth.provider.type org.apache.hadoop.fs.azurebfs.oauth2.ClientCredsTokenProvider

fs.azure.account.oauth2.client.id <your-service-client-id>

fs.azure.account.oauth2.client.secret <your-service-client-secret-key>

fs.azure.account.oauth2.client.endpoint https://login.microsoftonline.com/<directory-ID-of-Azure-AD>/oauth2/token

Si vous utilisez Azure comme cluster Databricks et exécutez le profil sur une ressource Microsoft Azure Data Lake Store, ajoutez le paramètre de configuration Spark avancé suivant pour le cluster Databricks et redémarrez le cluster :

spark.hadoop.fs.azure.account.key.<<ACCOUNT_NAME>>. dfs.core.windows.net <<VALUE>>

Télécharger et copier les fichiers JAR pour l'entrepôt de profilage

Obtenez les fichiers JAR du pilote JDBC Oracle DataDirect pour l'entrepôt de profilage. Vous pouvez copier les fichiers à partir de l'emplacement suivant :

<INFA_HOME>/services/shared/jars/thirdparty/com.informatica.datadirect-dworacle-6.0.0_F.jar

Placez les fichiers JAR du pilote JDBC Oracle DataDirect dans les emplacements suivants :

<INFA_HOME>/connectors/thirdparty/informatica.jdbc_v2/spark

<INFA_HOME>/connectors/thirdparty/informatica.jdbc_v2/common

<INFA_HOME>/services/shared/hadoop/<DataBricksversion>/runtimeLib

Télécharger et copier les fichiers JAR pour les objets Delta JBDC

Obtenez les fichiers .jar JDBC pour les objets delta JDBC. Vous pouvez télécharger les fichiers sur le site Web du fournisseur de la base de données.

Mettez à jour le fichier genericJDBC.zip avec les fichiers JAR delta JDBC à l'emplacement suivant :

INFA_HOME/services/CatalogService/ScannerBinaries

Recyclez le service de catalogue.

Configurer les propriétés personnalisées dans le service d'intégration de données

Lancez Informatica Administrator, puis sélectionnez

Service d'intégration de données

dans le

Navigateur de domaine

Cliquez sur l'option

Propriétés personnalisées

dans l'onglet

Propriétés

Définissez la propriété personnalisée suivante pour effectuer l'installation automatique des bibliothèques Informatica dans le cluster Databricks :

ExecutionContextOptions.databricks.enable.infa.libs.autoinstall: true

Recyclez le service d'intégration de données.

Sources prises en charge pour la découverte de domaines de données sur le cluster Databricks

Delta JDBC

Azure Data Lake Store Gen2

Gestion des domaines de données

Télécharger le guide

Envoyer les commentaires

Communities

Knowledge Base

Portail du succès

Rename Saved Search

Table des matières

Guide de Catalog Administrator

Guide de Catalog Administrator

Découverte de domaines de données sur le cluster Databricks

Découverte de domaines de données sur le cluster Databricks

Prérequis

Télécharger et copier les fichiers JAR pour l'entrepôt de profilage

Télécharger et copier les fichiers JAR pour les objets Delta JBDC

Configurer les propriétés personnalisées dans le service d'intégration de données

Sources prises en charge pour la découverte de domaines de données sur le cluster Databricks