Table des matières

Search

  1. Présentation de l'installation
  2. Avant l'installation Enterprise Data Catalog
  3. Installation d'Enterprise Data Catalog
  4. Après l'installation d'Enterprise Data Catalog
  5. Désinstallation
  6. Dépannage
  7. Démarrage et arrêt des services d'Enterprise Data Catalog
  8. Supprimer l'accès sudo après la création d'un cluster incorporé
  9. Configurer un répertoire journal personnalisé pour Ambari
  10. Configurer Enterprise Data Catalog pour un cluster avec WANdisco Fusion activé
  11. Configurer Informatica Custom Service Descriptor
  12. Créer des utilisateurs et des groupes d'utilisateurs personnalisés pour les services déployés dans un cluster incorporé
  13. Configurer des ports personnalisés pour les applications Hadoop

Guide d'installation et de configuration d'Enterprise Data Catalog

Guide d'installation et de configuration d'Enterprise Data Catalog

Dépannage du déploiement de clusters existants

Dépannage du déploiement de clusters existants

Échec de l'ingestion de métadonnées dans le catalogue.
Vérifiez que les fichiers de script du programme d'installation d'Enterprise Data Catalog qui lancent les tâches Solr et d'ingestion sont copiés vers l'hôte cible du cluster existant.
Puis-je implémenter la sécurité Kerberos si j'installe Enterprise Data Catalog sur un cluster existant ?
Oui. Enterprise Data Catalog prend en charge l'authentification réseau Kerberos sur un cluster existant.
Le service de catalogue s'est arrêté de façon inattendue et le message d'erreur dans le fichier journal se lit comme suit : « GSSException: No valid credentials provided (Mechanism level: Server not found in Kerberos database ». Comment résoudre le problème ?
Vérifiez que tous les nœuds de cluster du domaine /etc/hosts possèdent des noms d'hôtes complets et corrigez les noms d'hôtes incorrects.
J'ai un environnement de cluster Cloudera version 4 et je ne parviens pas à installer Enterprise Data Catalog sur le cluster.
Enterprise Data Catalog prend en charge Cloudera version 5.8 ou ultérieure ou HortonWorks version 2.5 pour le déploiement de cluster Hadoop existant. Mettez à niveau la version Cloudera vers 5.8 ou ultérieure.
J'ai ajouté quelques hôtes contenant des services de haute disponibilité au cluster à l'aide de CDH Manager. Cependant, je ne vois pas les nœuds activés.
Si vous avez ajouté des nœuds à un cluster existant, assurez-vous de les avoir ajoutés à la liste des nœuds Hadoop dans Informatica Administrator et redémarrez le service de catalogue.
Je rencontre des problèmes avec la disponibilité du centre de distribution Kerberos (KDC) et je vois des messages similaires à ceux qui suivent : « (java.security.PrivilegedActionException: javax.security.sasl.SaslException: GSS initiate failed [Caused by GSSException: No valid credentials provided (Mechanism level: Connection reset)]) occurred when evaluating Zookeeper Quorum Member's received SASL token. Zookeeper Client will go to AUTH_FAILED state. » Comment résoudre les problèmes ?
Un cluster compatible Kerberos requiert un KDC hautement disponible. Assurez-vous d'avoir activé la haute disponibilité pour KDC.
Le service d'ingestion est interrompu par le fil Apache en raison de problèmes généraux de mémoire avec des erreurs semblables à celles qui suivent : « Container killed by YARN for exceeding memory limits. 10.0 GB of 10 GB physical memory used. Consider boosting spark.yarn.executor.memoryOverhead. » Comment puis-je résoudre les erreurs ?
Le problème se produit en raison de vérifications de la mémoire Apache YARN. Il est recommandé que les deux propriétés suivantes aient la valeur False :
  • yarn.nodemanager.pmem-check-enabled
  • yarn.nodemanager.vmem-check-enabled
Après avoir brusquement arrêté un domaine et un service de catalogue, vous voyez que l'application YARN continue à s'exécuter.
Si vous n'arrêtez pas le domaine correctement, il est possible que les applications YARN pour HBase, Solr et Spark continuent à s'exécuter. Vous devez arrêter manuellement ces applications YARN avant de redémarrer le domaine et les services d'applications.


Mis à jour May 17, 2019


Explore Informatica Network