Table des matières

Search

  1. Présentation de l'installation
  2. Avant l'installation Enterprise Data Catalog
  3. Installation d'Enterprise Data Catalog
  4. Après l'installation d'Enterprise Data Catalog
  5. Désinstallation
  6. Dépannage
  7. Démarrage et arrêt des services d'Enterprise Data Catalog
  8. Supprimer l'accès sudo après la création d'un cluster incorporé
  9. Configurer un répertoire journal personnalisé pour Ambari
  10. Configurer Enterprise Data Catalog pour un cluster avec WANdisco Fusion activé
  11. Configurer Informatica Custom Service Descriptor
  12. Créer des utilisateurs et des groupes d'utilisateurs personnalisés pour les services déployés dans un cluster incorporé
  13. Configurer des ports personnalisés pour les applications Hadoop

Guide d'installation et de configuration d'Enterprise Data Catalog

Guide d'installation et de configuration d'Enterprise Data Catalog

Configuration d'Enterprise Data Catalog pour un cluster avec WANdisco Fusion activé

Configuration d'Enterprise Data Catalog pour un cluster avec WANdisco Fusion activé

Vous pouvez déployer Enterprise Data Catalog sur un cluster existant où WANdisco Fusion est activé. Les entreprises utilisent WANdisco Fusion pour répliquer et transférer des données entre des clusters Hadoop. Enterprise Data Catalog prend en charge les clusters Hadoop Cloudera et Hortonworks avec WANdisco Fusion.

Prérequis

Créez un répertoire avec l'autorisation read sur la machine où s'exécute le Domaine Informatica et copiez les fichiers JAR suivants à partir du cluster Hadoop vers le répertoire :
  • Pour un cluster Cloudera Hadoop :
    • hadoop-yarn-api-<version>-cdh<version>.jar
    • hadoop-yarn-common-<version>-cdh<version>.jar
    • hadoop-yarn-client-<version>-cdh<version>.jar
  • Pour un cluster Hortonworks Hadoop :
    • hadoop-yarn-api-<version>-hdp<version>.jar
    • hadoop-yarn-common-<version>-hdp<version>.jar
    • hadoop-yarn-client-<version>-hdp<version>.jar
    Vous pouvez copier les fichiers hadoop-yarn-api-<version>-<type cluster hadoop> <version>.jar, hadoop-yarn-common-<version>-<type cluster hadoop><version>.jar et hadoop-yarn-client-<version>-<type cluster hadoop><version>.jar à partir de la machine où vous avez installé le cluster Hadoop.
  • Copiez tous les fichiers JAR à partir de la machine où vous avez installé le client WANdisco Fusion vers le répertoire que vous avez créé. L'emplacement par défaut à partir duquel vous pouvez copier les fichiers JAR fusion est /opt/wandisco/fusion/client/lib sur la machine où vous avez installé le client WANdisco Fusion.
  • Assurez-vous que les Plugins listés dans l'interface WANdisco Fusion ont le statut Actif.
  • Si vous prévoyez d'exécuter un profilage sur le moteur Blaze pour des ressources, en fonction du type de cluster Hadoop que vous utilisez, assurez-vous de copier les fichiers suivants dans le répertoire <INFA_HOME>/services/shared/hadoop/<version-distribution>/lib :
    • Copiez tous les fichiers JAR à partir des chemins d'accès des bibliothèques du client fusion. Le chemin d'accès par défaut est /opt/wandisco/fusion/client/lib
    • Les fichiers suivants à partir de la machine où vous avez installé le cluster Hadoop :
      • hadoop-yarn-api-<version>-<type cluster hadoop> <version>.jar
      • hadoop-yarn-common-<version>-<type cluster hadoop><version>.jar
      • hadoop-yarn-client-<version>-<type cluster hadoop><version>.jar
Assurez-vous de configurer l'autorisation read pour le répertoire où les fichiers JAR sont présents.
Pour déployer Enterprise Data Catalog sur un cluster existant avec WANdisco Fusion activé, effectuez les étapes suivantes :
  1. Connectez-vous à Informatica Administrator.
  2. Sélectionnez le service de catalogue que vous avez configuré et cliquez sur Modifier.
  3. Ajoutez les propriétés personnalisées suivantes pour le service de catalogue :
    • LdmCustomOptions.deployment.is.wandisco.cluster. Définissez la valeur sur True dans la zone de texte Valeur. La valeur par défaut est False.
    • LdmCustomOptions.ldm.extra.jars.location. Spécifiez le chemin d'accès au répertoire qui inclut les fichiers JAR dans la zone de texte Valeur.
  4. Cliquez sur Terminer.
Si vous aviez créé le service de catalogue à l'aide du programme d'installation, le service est créé mais il ne démarre pas. Vous devez utiliser Informatica Administrator pour configurer les propriétés LdmCustomOptions.ldm.extra.jars.location et LdmCustomOptions.deployment.is.wandisco.cluster pour le service de catalogue et démarrer ensuite le service.


Mis à jour May 17, 2019


Explore Informatica Network