Table des matières

Search

  1. Présentation de l'installation
  2. Avant l'installation Enterprise Data Catalog
  3. Installation d'Enterprise Data Catalog
  4. Après l'installation d'Enterprise Data Catalog
  5. Désinstallation
  6. Dépannage
  7. Démarrage et arrêt des services d'Enterprise Data Catalog
  8. Supprimer l'accès sudo après la création d'un cluster incorporé
  9. Configurer un répertoire journal personnalisé pour Ambari
  10. Configurer Enterprise Data Catalog pour un cluster avec WANdisco Fusion activé
  11. Configurer Informatica Custom Service Descriptor
  12. Créer des utilisateurs et des groupes d'utilisateurs personnalisés pour les services déployés dans un cluster incorporé
  13. Configurer des ports personnalisés pour les applications Hadoop

Guide d'installation et de configuration d'Enterprise Data Catalog

Guide d'installation et de configuration d'Enterprise Data Catalog

Prérequis courants du système d'exploitation de Red Hat Enterprise Linux et de SUSE Linux Enterprise Server

Prérequis courants du système d'exploitation de Red Hat Enterprise Linux et de SUSE Linux Enterprise Server

Vous pouvez installer Enterprise Data Catalog sur une machine qui s'exécute sur Red Hat Enterprise Linux Server ou sur SUSE Linux Enterprise Server.
Vérifiez les prérequis courants suivants des SUSE et Red Hat Enterprise Linux Servers :
  • Vérifiez que le système d'exploitation est de version 64 bits.
  • Veillez à installer file.
  • Assurez-vous que Bash est le shell par défaut.
  • Si vous utilisez un compte d'utilisateur sans privilèges racine et que vous voulez supprimer l'accès à la commande sudo, assurez-vous que defaults requiretty est commenté dans /etc/sudoers.
  • Si vous utilisez un compte d'utilisateur sans privilèges racine, vérifiez que l'utilisateur Hadoop dispose des privilèges sudo.
  • Assurez-vous d'avoir désactivé l'invite de mot de passe de l'utilisateur Hadoop.
  • Assurez-vous d'avoir installé python-devel.
  • Assurez-vous d'avoir défini UMASK sur 022 (0022) ou sur 027 (0027).
  • Veillez à avoir défini le nom de domaine complet (FQDN) du nom d'hôte -f.
  • Assurez-vous que l'emplacement de /var ne dispose pas du privilège d'écriture pour tout le monde.
  • Veillez à avoir configuré les référentiels de base de Linux.
  • Assurez-vous d'avoir installé l'outil utilitaire réseau de ligne de commande netstat.
  • Vérifiez que le répertoire racine () dispose d'un minimum de 10 Go d'espace disque libre.
  • Si vous prévoyez d'installer Enterprise Data Catalog dans un cluster intégré et que vous voulez monter le service de cluster Informatica dans un emplacement de montage distinct, vérifiez que celui-ci dispose d'un minimum de 50 Go d'espace disque libre.
  • Assurez-vous que l'indicateur NOEXEC n'est pas défini pour le système de fichiers monté dans le répertoire /tmp.
  • Pour optimiser les performances, vous souhaiterez peut-être vous assurer que le répertoire /tmp dispose d'un minimum de 20 Go d'espace disque libre.
  • Veillez à avoir installé les utilitaires scp, curl, unzip, wget et tar.
  • Assurez-vous d'avoir configuré le répertoire home avec l'autorisation d'écriture.
  • Vérifiez que le fichier /etc/hosts configuré de toutes les machines incluent le nom de domaine complet des machines.
  • Veillez à ce que le démon NTP (Network Time Protocol) soit synchronisé et en cours d'exécution.
  • Vérifiez que le répertoire /tmp dispose de l'accès chmod 777 configuré pour le répertoire.
  • Vérifiez que les répertoires / et /var ne disposent pas de l'autorisation chmod 777 configurée.
  • Vérifiez que le répertoire /var dispose d'un minimum de 2 Go d'espace disque libre.
  • Vérifiez que le répertoire /usr dispose d'un minimum de 2 Go d'espace disque libre.
  • Veillez à désactiver Selinux ou définir Selinux sur le mode permissif.
  • Vérifiez que le répertoire /etc/hosts dispose d'une entrée pour l'adresse de bouclage 127.0.0.1 localhost localhost.domain.com
  • Assurez-vous d'avoir défini la limite de cœurs sur unlimited pour un utilisateur sans privilèges racine.
  • Pour configurer le répertoire workingDir sur /, confirmez que l'indicateur EXEC est défini dans le système de fichiers monté dans les répertoires /tmp et /var.
  • Si workingDir n'est pas configuré sur /, confirmez que les autorisations de lecture, d'écriture et d'exécution sont configurées pour le répertoire workingDir. Confirmez que l'indicateur EXEC est également défini pour le répertoire.
  • Assurez-vous de disposer de l'autorisation d'écriture dans le répertoire /home. Vous pouvez configurer l'autorisation dans le fichier /etc/default/useradd.
  • Assurez-vous que chaque machine du cluster inclut l'entrée 127.0.0.1 localhost localhost.localdomain dans le fichier /etc/hosts.
  • Vérifiez que le fichier /etc/hosts inclut les noms d'hôtes complets pour tous les nœuds de cluster. Vous pouvez également vérifier que la recherche DNS inversée renvoie les noms d'hôtes complets pour tous les nœuds de cluster.
  • Vérifiez que le répertoire Linux inclut postgresql version 8.14.18, publication 1.el6_4 ou versions ultérieures.
  • Assurez-vous d'avoir défini la limite non stricte du nombre max. de processus utilisateur à 32 000 au minimum.
  • Assurez-vous d'avoir défini la limite stricte du nombre max. de processus utilisateur à 32 000 au minimum.
  • Assurez-vous d'avoir défini la limite non stricte du nombre max. de processus utilisateur à 10 000 au minimum pour les nœuds de cluster.
  • Assurez-vous d'avoir défini la limite stricte du nombre max. de processus utilisateur à 10 000 au minimum pour les nœuds de cluster.
  • Sur chaque machine hôte, vérifiez que les outils et applications suivants sont disponibles :
    • YUM et RPM (RHEL/CentOS/Oracle Linux)
    • Zypper
    • scp, curl, unzip, tar et wget
    • awk
    • OpenSSL version 1.0.1e-30.el6_6.5.x86_64 ou versions ultérieures.
      Assurez-vous que la variable $PATH pointe vers le répertoire /usr/bin pour utiliser la version correcte de Linux OpenSSL.
  • Pour Enterprise Data Catalog installé dans un cluster intégré, installez les packages suivants si vous n'avez pas configuré le référentiel de base Linux ou si vous n'avez aucune connexion Internet :
    - Les RPM suivants sur l'hôte du serveur Ambari :
    • postgresql-libs
    • postgresql-server
    • postgresql
    - Les RPM suivants sur tous les nœuds de cluster :
    • nc
    • redhat-lsb
    • psmisc
    • python-devel


Mis à jour May 17, 2019


Explore Informatica Network