Table des matières

Search

  1. Présentation de l'installation
  2. Avant l'installation Enterprise Data Catalog
  3. Installation d'Enterprise Data Catalog
  4. Après l'installation d'Enterprise Data Catalog
  5. Désinstallation
  6. Dépannage
  7. Démarrage et arrêt des services d'Enterprise Data Catalog
  8. Supprimer l'accès sudo après la création d'un cluster incorporé
  9. Configurer un répertoire journal personnalisé pour Ambari
  10. Configurer Enterprise Data Catalog pour un cluster avec WANdisco Fusion activé
  11. Configurer Informatica Custom Service Descriptor
  12. Créer des utilisateurs et des groupes d'utilisateurs personnalisés pour les services déployés dans un cluster incorporé
  13. Configurer des ports personnalisés pour les applications Hadoop

Guide d'installation et de configuration d'Enterprise Data Catalog

Guide d'installation et de configuration d'Enterprise Data Catalog

Dépannage du déploiement de clusters incorporés

Dépannage du déploiement de clusters incorporés

Je vois des échecs de haute disponibilité dans le cluster incorporé.
La haute disponibilité est possible en cas de première installation d'Enterprise Data Catalog sur plus de deux nœuds. Vérifiez que le nombre de nœuds de cluster d'Enterprise Data Catalog n'est pas inférieur à trois. Si vous utilisez un nœud unique pour Enterprise Data Catalog pendant l'installation ou que vous ajoutez successivement plusieurs modes après l'installation, vous ne pourrez pas implémenter la haute disponibilité. Si l'un des hôtes hautement disponibles s'arrête ou est inaccessible, Enterprise Data Catalog peut continuer à s'exécuter, mais il est possible que le cluster ne soit pas hautement disponible. Vous devez alors configurer le nœud qui a été arrêté ou qui est inaccessible de façon à rendre le cluster hautement disponible.
Lorsqu'Oracle et le service de cluster Informatica s'exécutent sur la même machine, le service de cluster Informatica ne démarre pas.
Vérifiez si Oracle est en cours d'exécution sur le port 8080. Le port 8080 est réservé à Apache Ambari. Si Oracle et le service de cluster Informatica sont exécutés sur la même machine, assurez-vous d'exécuter Oracle sur un autre port.
L'outil Apache Ambari ne fonctionne pas après avoir installé Enterprise Data Catalog sur un cluster Hadoop incorporé.
  • Le nom d'hôte Ambari que vous spécifiez pendant l'installation est sensible à la casse. Vérifiez que le nom d'hôte répond aux exigences. Informatica recommande d'utiliser des minuscules pour les noms d'hôtes.
    Exécutez la commande suivante pour vérifier que le nom d'hôte est correctement configuré :
    #hostname -f
    La commande renvoie le nom de domaine complet que vous avez configuré.
  • Si vous avez installé Enterprise Data Catalog sur Red Hat Enterprise Linux (RHEL) version 6.5 ou ultérieure, vérifiez que tous les référentiels du système d'exploitation de base sont disponibles. Le programme d'installation d'Enterprise Data Catalog extrait de nombreux packages des référentiels du système d'exploitation de base. Par exemple, les hôtes doivent pouvoir accéder au référentiel rhel-6-server-optional-rpms de Red Hat Enterprise Linux pour que l'installation soit effectuée. Si vous ne disposez pas de l'ensemble complet des référentiels du système d'exploitation de base, vous pouvez rencontrer des problèmes d'installation.
  • Vérifiez la version de Python installée. Enterprise Data Catalog prend en charge Python version 2.6.8-0.15.1 ou antérieure. La version Python 2.7.9 ou ultérieure n'est pas prise en charge.
  • Avant d'installer Enterprise Data Catalog, vérifiez que les ports 8080, 8440 et 8411 ne sont pas utilisés. Apache Ambari utilise ces ports pendant l'installation.
Le service de cluster Informatica ne répond pas.
Assurez-vous de ne pas avoir d'autorisations 777 dans le répertoire /var. Toutefois, vous devez disposer de l'autorisation d'écriture dans le répertoire /var.
Le serveur Ambari de la base de données PostgreSQL par défaut s'arrête ou vous souhaitez déplacer le serveur Ambari d'un hôte vers un autre.
Vous pouvez effectuer les étapes suivantes pour configurer le serveur Ambari sur un nouvel hôte :
  1. Désactivez le service de cluster Informatica à l'aide d'Informatica Administrator.
  2. Redémarrez l'instance PostgreSQL sur l'hôte du serveur Ambari. Sauvegardez les bases de données PostgreSQL ambarirca et ambari.
    Pour en savoir plus sur la sauvegarde des bases de données PostgreSQL, reportez-vous à la section Déplacement du serveur Ambari dans la documentation de HortonWorks.
  3. Mettez à jour la valeur du nom d'hôte du serveur Ambari du service de cluster Informatica avec le nouveau nom d'hôte du serveur Ambari. Pour mettre à jour le nom d'hôte dans Informatica Administrator, sélectionnez le service de catalogue, puis, dans le champ Service de cluster Informatica sous Options du cluster Hadoop, entrez le nom d'hôte.
  4. Activez le service de cluster Informatica. Cette action installe le serveur Ambari sur le nouvel hôte de passerelle Hadoop que vous avez fourni et met à jour l'agent Ambari avec le nouvel hôte de serveur Ambari.
  5. Désactivez le service de cluster Informatica.
  6. Supprimez les deux bases de données ambarirca et ambari de l'instance PostgreSQL sur le nouvel hôte de passerelle Hadoop.
  7. Restaurez les deux bases de données ambarirca et ambari à partir de la sauvegarde de l'hôte de passerelle Hadoop précédent.
    Pour en savoir plus sur la restauration des bases de données PostgreSQL à partir d'une sauvegarde, reportez-vous à la section Déplacement du serveur Ambari dans la documentation de HortonWorks.
  8. Activez le service de cluster Informatica.
Le serveur Apache Ambari ne parvient pas à démarrer et le message d'erreur suivant s'affiche dans le fichier journal correspondant : About to start PostgreSQLERROR: Exiting with exit code 1.REASON: Unable to start PostgreSQL server. Exiting
Ajoutez 127.0.0.1 localhost localhost.localdomain au fichier /etc/hosts.
Je vois que le cluster n'est pas hautement disponible.
Vérifiez que tous les nœuds qui hébergent des composants de haute disponibilité sont bien en cours d'exécution. Si l'un des nœuds qui héberge des composants de haute disponibilité s'arrête, le cluster cesse d'être hautement disponible. Assurez-vous de configurer le nœud qui s'était arrêté.
Lorsque l'un des nœuds esclaves du cluster est inaccessible, je ne peux pas activer le service de cluster Informatica.
Si l'un des nœuds esclaves est inaccessible en raison d'une défaillance inattendue, vous devez supprimer l'hôte de la liste des agents Apache Ambari dans Informatica Administrator, ou reconfigurer le nœud esclave avant de recycler le service de cluster d'Informatica.
J'ai supprimé un service de catalogue existant et en ai activé un nouveau. Cependant, je suis incapable d'accéder aux données du catalogue et de les utiliser.
Si vous souhaitez pointer un nouveau service de catalogue vers les données existantes du catalogue, assurez-vous de spécifier pour le nouveau service de catalogue le même nom de cluster de service que celui que vous avez utilisé pour le service de catalogue supprimé. Spécifiez le nom du cluster de service dans Informatica Administrator sous la section Options du cluster Hadoop dans l'onglet Propriétés.
Après avoir ajouté quelques nœuds à un cluster incoporé existant, Apache Ambari Metrics System ne démarre pas.
Cet échec peut se produire parce que certaines machines, en particulier les machines virtuelles, ne disposent pas des packages système requis. Veillez à ce que les nouveaux hôtes que vous ajoutez répondent aux prérequis pour le déploiement du cluster incorporé d'Enterprise Data Catalog. Reportez-vous aux sections Prérequis et Préparation de l'environnement de cluster Hadoop incorporé du chapitre Méthodes de déploiement de ce guide.
Échec de l'agent Apache Ambari avec l'un des messages d'erreur suivants dans le fichier journal de l'agent Ambari : NetUtil.py:67 - SSLError: Failed to connect. Please check openssl library versions or INFO 2014-04-02 04:25:22,669 NetUtil.py:55 - Failed to connect to https://{ambari-server}:8440/cert/ca due to [Errno 1] _ssl.c:492: error:100AE081:elliptic curve routines:EC_GROUP_new_by_curve_name:unknown group
Une des conditions préalables pour que l'agent Apache Ambari fonctionne correctement est d'avoir une version 16 ou ultérieure d'OpenSSL. Vous pouvez effectuer les étapes suivantes :
  1. Vérifiez la version de la bibliothèque OpenSSL installée sur vos hôtes à l'aide de la commande suivante :
    rpm -qa | grep openssl
  2. Si la sortie de la commande précédente lit openssl-1.0.1e-15.x86_64 (1.0.1 Build 15), vous devez mettre à niveau la bibliothèque OpenSSL. Pour mettre à niveau la bibliothèque OpenSSL, exécutez la commande suivante :
    yum upgrade openssl
  3. Vérifiez que la nouvelle version d'OpenSSL est installée en utilisant la commande rpm.
  4. Redémarrez les agents Apache Ambari et cliquez sur RéessayerÉchec dans l'interface utilisateur de l'assistant.
Lorsque vous installez Enterprise Data Catalog sur un cluster incorporé, le programme d'installation ne crée pas le service de cluster Informatica en raison de problèmes d'autorisation.
Si l'utilisateur racine ne dispose pas de l'autorisation requise pour ajouter des utilisateurs sous le répertoire de base de l'utilisateur, le fichier journal des tâches affiche le message d'erreur suivant :
Execution of 'useradd -m -G hadoop -g hadoop mapred' returned 12. useradd: cannot create directory /home/mapred
Vous pouvez alors modifier le répertoire d'accueil de l'utilisateur de la machine virtuelle en répertoire pour lequel l'utilisateur racine dispose de l'autorisation de création :
sudo vim /etc/default/useradd
Passez le répertoire de base en HOME=/export/home.
Échec du serveur de chronologie d'application Apache Ambari avec le message d'erreur suivant : ps -p 'hadoop-yarn/yarn/yarn-yarn-timelineserver.pid' failed: https://issues.apache.org/jira/browse/AMBARI-4825
Ce problème peut se produire parce que plusieurs terminaux sont actifs. Utilisez les commandes w, whoami et kill pour vérifier et fermer tous les terminaux excepté celui qui est pertinent. Vous pouvez ensuite redémarrer le cluster YARN.
L'installation du serveur Apache Ambari échoue sur certaines machines hôtes et l'erreur suivante apparaît dans les fichiers journaux du serveur Ambari : Ambari-server status Traceback (most recent call last) File "/usr/sbin/ambari-server.py", line 26, in <module> from ambari_commons.exceptions import FatalException, NonFatalException ImportError: No module named ambari_commons.exceptions.
Ce problème se produit lorsque vous essayez d'installer un serveur Ambari sur un hôte unique qui dispose d'un agent Ambari d'une installation précédente. Le lien /usr/lib/python2.6/site-packages/ambari_commons doit pointer vers /usr/lib/ambari-server/lib/ambari_commons au lieu de /usr/lib/ambari-agent/lib/ambari_commons.
Lorsque vous ajoutez uniquement deux nœuds au cluster, l'installation du cluster échoue avec le code d'erreur suivant 00030: Cannot create a cluster with 2 hosts. Minimum 3 hosts are required for creating the High Availability cluster.
Vous ne pouvez pas créer de cluster avec seulement deux nœuds. Vous devez fournir au moins trois nœuds pour un cluster à haute disponibilité et un hôte pour un cluster qui n'est pas de haute disponibilité. Vous pouvez ajouter des nœuds à un cluster à nœud unique existant déjà configuré. Toutefois, vous ne pouvez pas configurer le cluster en tant que cluster à haute disponibilité.
Lorsque vous créez un cluster, la vérification de la configuration système minimale requise échoue avec l'un des codes d'erreur suivants : 00026, 00027 ou 00028.
Si vous disposez d'un cluster à nœud unique, la machine hôte doit respecter les critères de configuration minimale pour les nœuds principaux. Si vous disposez d'un cluster à haute disponibilité, au moins trois des machines hôtes doivent satisfaire aux critères de configuration minimale pour les nœuds principaux. Les machines hôtes restantes doivent satisfaire aux critères de configuration minimale pour les nœuds esclaves.
Vous ne pouvez pas supprimer un nœud du cluster et vous voyez l'un des codes d'erreur suivants dans le fichier journal : 00035 ou 00036.
Le code d'erreur 00035 indique que lors de la suppression du nœud, le nombre de nœuds de données en direct dans le cluster se réduit à moins de trois. Le nombre minimal de nœuds en direct requis dans le cluster est de trois. Le code d'erreur 0036 indique qu'il y a eu une tentative de suppression d'un nœud qui héberge les services principaux. Vous ne pouvez pas supprimer un nœud qui héberge les services principaux.
Le nœud de données HDFS affiche des erreurs indiquant fréquemment des opérations inconnues avec les erreurs suivantes dans les fichiers journaux du nœud de données : DataXceiver error processing unknown operation src: /127.0.0.1:33349 dst: /127.0.0.1:50010 java.io.EOFException at java.io.DataInputStream.readShort DataInputStream.java:315) at org.apache.hadoop.hdfs.protocol.datatransfer.Receiver.readOp Receiver.java:58)
Apache Ambari ouvre une connexion de socket au nœud de données HDFS chaque minute pour le surveiller. Vous pouvez ignorer ces erreurs, car elles n'affectent pas les opérations de cluster.
Le domaine Informatica, le service d'intégration de données et le service de gestion de contenu sont sécurisés à l'aide du protocole SSL. Si je change les paramètres du service de catalogue de façon à activer le mode SSL, le service ne parvient pas à démarrer. Comment résoudre le problème ?
Après avoir configuré le domaine Informatica, le service d'intégration de données et le service de gestion de contenu de façon à les sécuriser avec le protocole SSL à l'aide du programme d'installation LDM, effectuez les opérations suivantes :
  1. Exportez le certificat keystore du service de catalogue.
  2. Importez le certificat keystore dans le fichier truststore Informatica.
  3. Placez le fichier truststore Informatica sur tous les nœuds Hadoop. Assurez-vous de suivre la même structure de répertoire pour le fichier truststore sur toutes les machines hôtes.
  4. Dans Informatica Administrator, spécifiez l'emplacement du fichier truststore Informatica commun dans le champ Emplacement du fichier truststore du domaine de la section Options avancées du service de cluster Informatica.
  5. Dans la boîte de dialogue Modifier les propriétés de sécurité de l'onglet Processus du service de cluster Informatica, sélectionnez Activer TLS (Transport Layer Security) et spécifiez le chemin d'accès au fichier keystore mentionné à l'étape 1.
  6. Activez le service de cluster Informatica. Si le service est déjà activé, désactivez-le en mode Complet, puis réactivez le service.
  7. Accédez à la section Propriétés de sécurité du service de catalogue et spécifiez le chemin d'accès au fichier keystore mentionné à l'étape 1.
  8. Activez le service de catalogue.
Je ne trouve pas les fichiers Apache Ambari dans le programme d'installation pour créer le service de cluster Informatica sur le cluster incorporé.
Si vous choisissez de créer le service de cluster Informatica sur le cluster incorporé, vous pouvez copier les fichiers ambaribinaries.tar.gz dans le répertoire Installer/services/InfaHadoopService/Binaries.


Mis à jour May 17, 2019


Explore Informatica Network