Table des matières

Search

  1. Présentation de l'installation
  2. Avant l'installation Enterprise Data Catalog
  3. Installation d'Enterprise Data Catalog
  4. Après l'installation d'Enterprise Data Catalog
  5. Désinstallation
  6. Dépannage
  7. Démarrage et arrêt des services d'Enterprise Data Catalog
  8. Supprimer l'accès sudo après la création d'un cluster incorporé
  9. Configurer un répertoire journal personnalisé pour Ambari
  10. Configurer Enterprise Data Catalog pour un cluster avec WANdisco Fusion activé
  11. Configurer Informatica Custom Service Descriptor
  12. Créer des utilisateurs et des groupes d'utilisateurs personnalisés pour les services déployés dans un cluster incorporé
  13. Configurer des ports personnalisés pour les applications Hadoop

Guide d'installation et de configuration d'Enterprise Data Catalog

Guide d'installation et de configuration d'Enterprise Data Catalog

Installation en joignant un domaine

Installation en joignant un domaine

Vous pouvez joindre un domaine si vous effectuez l'installation sur plusieurs machines et que vous avez créé un domaine sur une autre machine.
  1. Connectez-vous à la machine à l'aide d'un compte utilisateur système.
  2. Fermez toutes les autres applications.
  3. Exécutez la commande ./install.sh pour démarrer le programme d'installation.
    Le programme d'installation affiche un message vous invitant à lire la documentation d'Informatica avant de procéder à l'installation.
  4. Appuyez sur O pour continuer l'installation.
  5. Appuyez sur 1 pour installer les produits de la suite Informatica Big Data.
  6. Appuyez sur 1 pour exécuter l'outil Pre-installation System Check. L'outil vérifie si votre machine répond à la configuration système minimale requise pour installer ou mettre à niveau Informatica.
    Vous pouvez ignorer cette étape si vous êtes sûr que votre machine répond à la configuration système minimale requise pour installer ou mettre à niveau Informatica.
  7. Appuyez sur 3 pour installer Informatica.
  8. Appuyez sur 2 pour accepter les conditions générales de l'installation ou de la mise à niveau.
  9. Appuyez sur 2 pour confirmer que vous comprenez que la version 10.2.2 est spécifique à la suite de produits Big Data et poursuivre l'installation.
  10. Appuyez sur 2 pour installer les services Informatica avec Enterprise Data Catalog.
    Le programme d'installation vous invite à confirmer que la version actuelle des services Informatica n'est pas installée sur le nœud.
  11. Appuyez sur 1 si vous n'avez pas la version actuelle des services Informatica installée. Sinon, appuyez sur 2.
  12. Choisissez le type de cluster Hadoop pour Enterprise Data Catalog. Appuyez sur 2 pour déployer Enterprise Data Catalog sur une distribution Hadoop interne sur HortonWorks à l'aide de l'outil Ambari. Appuyez sur 1 pour déployer Enterprise Data Catalog sur une distribution Hadoop existante sur Cloudera, HortonWorks ou Azure HDInsight.
    Selon les paramètres que vous spécifiez, Enterprise Data Catalog crée un service de cluster Informatica pour la distribution Hadoop interne.
  13. Si vous avez choisi la distribution Hadoop intégrée, indiquez les informations suivantes après la configuration du domaine Informatica, du service de référentiel modèle et du service d'intégration de données :
    OptionDescription
    Nom d'utilisateur SSH Nom d'utilisateur de la connexion Secure Shell (SSH) sans mot de passe
    Nom du service de cluster InformaticaNom du service de cluster Informatica pour le cluster interne.
    Port du service de cluster InformaticaNuméro de port du service de cluster Informatica.
    Hôte du serveur AmbariInformations d'hôte du serveur Ambari. Ambari est un outil Web destiné à l'approvisionnement, à la gestion et à la surveillance des grappes Hadoop Apache. Il prend en charge Hadoop HDFS, Hadoop MapReduce, Hive, HBase et ZooKeeper.
    Hôtes de l'agent Ambari séparés par des virgulesS'applique à la haute disponibilité. Si vous utilisez plusieurs hôtes d'agents Ambari, spécifiez leurs noms séparés par des virgules.
    Port Web AmbariNuméro de port sur lequel le serveur Ambari doit s'exécuter.
    Nom du service de catalogueNom du service de catalogue.
    Port du service de catalogueNuméro de port du service de catalogue.
    Emplacement du fichier keytab S'applique à un cluster activé pour Kerberos. Emplacement du fichier keytab fusionné de l'utilisateur et de l'hôte.
    Fichier de configuration KerberosS'applique à un cluster activé pour Kerberos. Emplacement du fichier de configuration Kerberos.
    • Spécifiez les détails suivants si vous sélectionnez un cluster existant :
      Propriété Description
      Distribution Hadoop Sélectionnez l'une des options suivantes :
      • ClouderaManager
      • HDInsight
      • Hortonworks
      URL du cluster Nom d'hôte complet pour accéder au cluster.
      Nom d'utilisateur de l'URL du cluster Nom d'utilisateur pour accéder au cluster.
      Mot de passe de l'URL du cluster Mot de passe du nom d'utilisateur de l'URL du cluster.
    • Si vous avez choisi la distribution Hadoop existante ClouderaManager ou Hortonworks, indiquez les informations suivantes :
    OptionDescription
    Nom du service de catalogueNom du service de catalogue.
    Port du service de catalogueNuméro de port du service de catalogue.
    URI du gestionnaire de ressources Yarn Service au sein d'Hadoop qui envoie les tâches MapReduce aux nœuds spécifiques dans la grappe.
    Utiliser le format suivant :
    <hostname>:<port>
    • hostname est le nom ou l'adresse IP du gestionnaire de ressources Yarn.
    • port est le port sur lequel le gestionnaire de ressources Yarn écoute les appels de procédure distante (RPC).
    URI http du gestionnaire de ressources YarnValeur de l'URI http du gestionnaire de ressources Yarn.
    URI du planificateur du gestionnaire de ressources YarnValeur de l'URI du planificateur du gestionnaire de ressources Yarn.
    URI du cluster ZookeeperURI du service Zookeeper, un service de coordination hautes performances pour les applications distribuées.
    URI du namenode HDFS L'URI pour accéder à HDFS.
    Utilisez le format suivant pour spécifier l'URI du NameNode dans la distribution Cloudera :
    hdfs://<namenode>:<port>
    • <namenode> est le nom d'hôte ou l'adresse IP du NameNode.
    • <port> est le port sur lequel le NameNode écoute les appels de procédure distante (RPC).
    Nom du cluster de service Nom du cluster de service. Assurez-vous d'avoir un répertoire /Informatica/LDM/<ServiceClusterName> dans HDFS avant que l'installation soit complète.
    Si vous ne spécifiez pas un nom de cluster de service, Enterprise Data Catalog considère DomainName_CatalogServiceName comme la valeur par défaut. Le répertoire /Informatica/LDM/<DomainName>_<CatalogServiceName> doit alors se trouver dans HDFS. Sinon, le service de catalogue pourrait échouer.
    URI HTTP du serveur d'historique URI HTTP pour accéder au serveur d'historique.
    Le cluster est-il sécurisé ?Définissez cette propriété sur l'une des valeurs suivantes si vous disposez d'un cluster existant sécurisé :
    • 1 : spécifie que le cluster existant n'est pas sécurisé.
    • 2 : spécifie que le cluster existant est sécurisé.
    La valeur par défaut est 1.
    L'authentification SSL est-elle activée sur le cluster ?
    Uniquement applicable si vous aviez sélectionné la distribution Hadoop Hortonworks et ClouderaManager.
    Définissez cette propriété sur l'une des valeurs suivantes si vous disposez d'un cluster existant activé pour SSL :
    • 1 : spécifie que le cluster existant n'est pas activé pour SSL.
    • 2 : spécifie que le cluster existant est activé pour SSL.
    La valeur par défaut est 1.
    Activer l'authentification KerberosDéfinissez cette propriété sur l'une des valeurs suivantes si vous disposez d'un cluster existant activé pour Kerberos :
    • 1 : spécifie que le cluster existant n'est pas activé pour Kerberos.
    • 2 : spécifie que le cluster existant est activé pour Kerberos.
  14. Appuyez sur Entrée pour continuer.
    Vous voyez un message d'invite sur le fichier de clé de licence.
  15. Appuyez sur 2 pour que le programme d'installation règle les services d'applications Informatica en fonction de la taille des données déployées.
    Le programme d'installation affiche les options suivantes pour différentes tailles de données :
    • Sandbox
    • De base
    • Standard
    • Concurrence élevée et volume élevé
  16. Tapez le chemin d'accès et le nom de fichier de la clé de licence Informatica, puis appuyez sur Entrée.
  17. Tapez le chemin d'accès absolu du répertoire d'installation.
    Les noms de répertoires du chemin d'accès ne doivent pas contenir d'espaces ni les caractères spéciaux suivants : @|* $ # ! % ( ) { } [ ] , ; ' Par défaut /home/toolinst.
    Informatica recommande d'utiliser des caractères alphanumériques dans le chemin d'accès au répertoire d'installation. Si vous utilisez un caractère spécial comme á ou €, des résultats inattendus peuvent se produire lors de l'exécution.
  18. Appuyez sur 2 pour exécuter l'utilitaire de pré-validation. L'utilitaire vous aide à valider les prérequis pour installer Enterprise Data Catalog dans un cluster intégré. L'utilitaire valide également la configuration du domaine Informatica, des hôtes de cluster et des services de cluster Hadoop.
    Le programme d'installation vous invite à confirmer si vous souhaitez activer l'authentification Kerberos pour le cluster.
  19. Appuyez sur 2 pour activer l'authentification Kerberos du cluster, et indiquez les détails suivants :
    1. Emplacement du fichier keytab. Emplacement du fichier keytab fusionné de l'utilisateur et de l'hôte.
    2. Fichier de configuration Kerberos. Emplacement du fichier de configuration Kerberos.
  20. Indiquez le nom d'utilisateur de la passerelle, et appuyez sur Entrée. La valeur par défaut est racine.
  21. Indiquez le nom d'hôte de passerelle du cluster Hadoop d'Informatica au format suivant : <hostname>.<FQDN> et appuyez sur la touche Entrée.
  22. Indiquez la liste des nœuds du cluster Hadoop d'Informatica séparés par des virgules, comme indiqué au format suivant : <hostname>.<FQDN>, <hostname1>.<FQDN>, <hostname2>.<FQDN> et appuyez sur la touche Entrée.
  23. Indiquez le port de passerelle du cluster Hadoop d'Informatica, et appuyez sur Entrée. La valeur par défaut est 8080.
    Assurez-vous que vous ne configurez pas Oracle avec le port 8080 sur la même machine où le service de cluster Informatica s'exécute.
  24. Indiquez le chemin d'accès au répertoire de travail, et appuyez sur Entrée. Le chemin d'accès indique l'emplacement où vous souhaitez monter le service de cluster Informatica.
    Le programme d'installation démarre l'utilitaire de pré-validation.
  25. Appuyez sur Entrée pour continuer après avoir exécuté l'utilitaire de pré-validation.
  26. Examinez les informations d'installation, et appuyez sur Entrée pour continuer.
    Le programme d'installation copie les fichiers d'Enterprise Data Catalog dans le répertoire d'installation. Vous voyez une invite pour créer ou joindre un domaine.
  27. Appuyez sur 2 pour joindre un domaine.
    Le programme d'installation crée un nœud sur la machine sur laquelle vous effectuez l'installation. Vous pouvez indiquer le type de nœud à créer et le domaine à joindre.
  28. Indiquez si la communication sécurisée est activée sur le domaine que vous voulez joindre.
    Appuyez sur 1 pour joindre un domaine non sécurisé ou sur 2 pour joindre un domaine sécurisé.
  29. Sélectionnez le type de nœud à créer.
    Le tableau suivant décrit les types de nœuds que vous pouvez créer :
    Propriété
    Description
    Configurer ce nœud comme une passerelle
    Indiquez si vous souhaitez configurer le nœud comme une passerelle ou un nœud de travail.
    1 - Oui
    2 - Non
    Sélectionnez 1 pour configurer un nœud de passerelle ou 2 pour configurer un nœud de travail.
    Si vous configurez le nœud en tant que passerelle, vous pouvez activer une connexion HTTPS sécurisée à Informatica Administrator.
  30. Spécifiez les détails de connexion à Informatica Administrator.
    1. Indiquez si vous souhaitez définir une connexion HTTPS sécurisée à Informatica Administrator.
      Le tableau suivant décrit les options disponibles permettant d'activer ou de désactiver une connexion sécurisée à Informatica Administrator :
      Option
      Description
      1 - Activer HTTPS pour Informatica Administrator
      Configurer une connexion sécurisée à Informatica Administrator.
      2 - Désactiver HTTPS
      Ne pas configurer une connexion sécurisée à Informatica Administrator.
    2. Si vous activez une connexion HTTPS pour Informatica Administrator, entrez le fichier keystore et le numéro de port à utiliser pour sécuriser la connexion.
      Le tableau suivant décrit les informations de connexion que vous devez entrer si vous activez HTTPS :
      Option
      Description
      Port
      Numéro de port de la connexion HTTPS.
      Fichier keystore
      Indiquez si vous souhaitez utiliser un fichier keystore généré par le programme d'installation ou un fichier keystore que vous créez. Vous pouvez utiliser un fichier keystore avec un certificat auto-signé ou un certificat signé par une autorité de certification.
      1 - Utiliser un keystore généré par le programme d'installation
      2 - Spécifier un fichier et un mot de passe keystore
      Si vous choisissez d'utiliser un fichier keystore généré par le programme d'installation, ce dernier crée un fichier keystore auto-signé nommé Default.keystore à l'emplacement suivant : <Répertoire d'installation Informatica>/tomcat/conf/
    3. Si vous spécifiez le keystore, entrez le mot de passe et l'emplacement du fichier keystore.
  31. Appuyez sur 2 pour activer l'authentification unique utilisant l'authentification SAML pour les applications d'Enterprise Data Catalog.
  32. Indiquez l'URL du fournisseur d'identité (IdP) SAML, et appuyez sur Entrée.
    Consultez la section Configurer l'authentification unique avec l'authentification SAML pour en savoir plus sur la configuration à effectuer après avoir installé Enterprise Data Catalog.
    Si vous avez activé la communication sécurisée pour le domaine, la section Sécurité du domaine - Communication sécurisée s'affiche. Si vous n'avez pas activé la communication sécurisée pour le domaine, la page Référentiel de configuration du domaine s'affiche.
  33. Sur la page Sécurité du domaine - Communication sécurisée, indiquez si vous souhaitez utiliser les certificats SSL Informatica par défaut ou des certificats SSL que vous fournissez pour sécuriser la communication du domaine.
    1. Sélectionnez le type de certificat SSL à utiliser.
      Le tableau suivant décrit les options des certificats SSL que vous pouvez utiliser pour sécuriser le domaine Informatica :
      Option Description
      1 - Utiliser les fichiers de certificat SSL Informatica par défaut Permet d'utiliser les certificats SSL par défaut fournis par Informatica.
      Si vous ne fournissez pas de certificat SSL, Informatica utilise la même clé privée par défaut pour toutes les installations d'Informatica. Si vous utilisez les fichiers entrepôt de clés et truststore Informatica par défaut, la sécurité de votre domaine peut être compromise. Pour assurer un niveau élevé de sécurité pour le domaine, sélectionnez l'option permettant de spécifier l'emplacement des fichiers de certificat SSL.
      2 - Spécifier l'emplacement des fichiers de certificat SSL Permet d'utiliser les certificats SSL que vous fournissez. Vous devez spécifier l'emplacement des fichiers keystore et truststore.
      Vous pouvez fournir un certificat auto-signé ou un certificat émis par une autorité de certification (CA). Vous devez fournir les certificats SSL dans le format PEM et dans des fichiers keystore Java (JKS, Java Keystore). Informatica requiert des noms de fichier de certificat SSL spécifiques pour le domaine Informatica. Vous devez utiliser les mêmes certificats SSL pour tous les nœuds du domaine. Stockez les fichiers truststore et keystore dans un répertoire accessible à tous les nœuds du domaine et spécifiez le même répertoire de fichiers keystore et truststore pour tous les nœuds d'un même domaine.
    2. Si vous indiquez le certificat SSL, spécifiez l'emplacement et les mots de passe des fichiers keystore et truststore.
      Le tableau suivant décrit les paramètres que vous devez entrer pour les fichiers de certificat SSL :
      Propriété Description
      Répertoire de fichiers keystore Répertoire contenant les fichiers keystore. Il doit contenir les fichiers infa_keystore.jks et infa_keystore.pem.
      Mot de passe keystore Mot de passe du fichier keystore infa_keystore.jks.
      Répertoire de fichiers truststore Répertoire contenant les fichiers truststore. Il doit contenir les fichiers infa_truststore.jks et infa_truststore.pem.
      Mot de passe truststore Mot de passe du fichier infa_truststore.jks.
    La page Référentiel de configuration du domaine s'affiche.
  34. À l'invite, entrez les informations relatives au domaine à joindre.
    Le tableau suivant décrit les propriétés que vous indiquez pour le domaine :
    Propriété
    Description
    Nom de domaine
    Nom du domaine à joindre.
    Hôte du nœud de passerelle
    Nom d'hôte de la machine qui héberge le nœud de passerelle pour le domaine.
    Port du nœud de passerelle
    Numéro de port du nœud de passerelle.
    Nom d'utilisateur de domaine
    Nom d'utilisateur de l'administrateur du domaine à joindre.
    Mot de passe du domaine
    Mot de passe de l'administrateur du domaine.
    La page Sécurité du domaine - Clé de chiffrement s'affiche.
  35. Entrez les informations sur la clé de chiffrement pour le domaine Informatica à joindre.
    Si l'emplacement de la clé de chiffrement dans le nœud de passerelle n'est pas accessible au nœud actuel, copiez le fichier de clé de chiffrement dans un répertoire accessible. Vous devrez peut-être attribuer une autorisation de lecture au répertoire qui contient le fichier de clé de chiffrement sur le nœud de passerelle pour pouvoir copier le fichier.
    Le tableau suivant décrit les paramètres de clé de chiffrement que vous devez spécifier lorsque vous joignez un domaine :
    Propriété Description
    Sélectionnez la clé de chiffrement
    Chemin et nom de fichier de la clé de chiffrement pour le domaine Informatica à joindre. Tous les nœuds du domaine Informatica utilisent la même clé de chiffrement. Vous devez spécifier le fichier de clé de chiffrement créé sur le nœud de passerelle pour le domaine à joindre.
    Si vous avez copié le fichier de clé de chiffrement vers un répertoire temporaire pour le rendre disponible aux nœuds dans le domaine, spécifiez le chemin et le nom du fichier de la clé de chiffrement dans le répertoire temporaire.
    Répertoire de la clé de chiffrement Répertoire dans lequel stocker la clé de chiffrement sur le nœud créé lors de cette installation. Le programme d'installation copie le fichier de clé de chiffrement du domaine dans le répertoire de la clé de chiffrement du nouveau nœud.
  36. Sur la page Joindre une configuration de nœud de domaine, entrez les informations du nœud à créer.
    Le tableau suivant décrit les propriétés que vous définissez pour le nœud :
    Propriété
    Description
    Nom d'hôte du nœud
    Nom d'hôte de nœud. Le nom d'hôte du nœud ne peut pas contenir le caractère de soulignement (_).
    N'utilisez pas localhost. Le nom d'hôte doit explicitement identifier la machine.
    Nom du nœud
    Nom du nœud Informatica à créer sur cette machine. Le nom du nœud n'est pas le nom d'hôte de la machine.
    Numéro de port du nœud
    Numéro de port du nœud.
    Fichier truststore de base de données Chemin d'accès et nom du fichier truststore de la base de données sécurisée. Sélectionnez le même fichier truststore de base de données que celui utilisé par le nœud principal de passerelle dans le domaine.
    Disponible lorsque vous joignez un nœud de passerelle à un domaine qui utilise une base de données de référentiel de configuration du domaine qui est sécurisée avec le protocole SSL.
    Mot de passe truststore Mot de passe du fichier truststore de la base de données sécurisée.
    Disponible lorsque vous joignez un nœud de passerelle à un domaine qui utilise une base de données de référentiel de configuration du domaine qui est sécurisée avec le protocole SSL.
  37. Indiquez si vous souhaitez afficher les ports par défaut pour les composants de domaine et de nœud attribués par le programme d'installation.
    Le tableau suivant décrit la page de configuration avancée des ports :
    Invite
    Description
    Afficher la page de configuration avancée des ports
    Indiquez si vous souhaitez afficher les numéros de port pour les composants de domaine et de nœud attribués par le programme d'installation :
    1 - Non
    2 - Oui
    Si vous sélectionnez Oui, le programme d'installation affiche les numéros de port par défaut attribués aux composants du domaine. Vous pouvez indiquer les numéros de port à utiliser pour les composants de domaine et de nœud. Vous pouvez également indiquer une plage de numéros de port à utiliser pour le processus de service qui s'exécute sur le nœud. Vous pouvez utiliser les numéros de port par défaut ou spécifier de nouveaux numéros de port. Vérifiez que les numéros de ports que vous entrez ne sont pas utilisés par d'autres applications.
  38. Si vous affichez la page de configuration des ports, entrez les nouveaux numéros de port à l'invite ou appuyez sur Entrée pour utiliser les numéros de port par défaut.
    Port
    Description
    Port de gestionnaire de service
    Numéro de port utilisé par le Gestionnaire de service sur le nœud. Le gestionnaire de service écoute les demandes de connexions entrantes sur ce port. Les applications clientes utilisent ce port pour communiquer avec les services du domaine. Les programmes de ligne de commande Informatica utilisent ce port pour communiquer avec le domaine. Ce port est également utilisé par le pilote JDBC/ODBC du service de données SQL. La valeur par défaut est 6006.
    Port d'arrêt du gestionnaire de service
    Numéro de port qui contrôle l'arrêt du serveur pour le Gestionnaire de service du domaine. Le gestionnaire de service écoute les commandes d'arrêt sur ce port. La valeur par défaut est 6007.
    Port d'Informatica Administrator
    Numéro de port utilisé par Informatica Administrator. La valeur par défaut est 6008.
    Port HTTPS d'Informatica Administrator
    Aucun port par défaut. Entrez le numéro de port requis lorsque vous créez le service. Configurer le port sur 0 désactive la connexion HTTPS à l'outil Administrator tool.
    Port d'arrêt d'Informatica Administrator
    Numéro de port qui contrôle l'arrêt du serveur pour Informatica Administrator. Informatica Administrator écoute les demandes d'arrêt sur ce port. La valeur par défaut est 6009.
    Numéro de port minimal
    Plus petit numéro de port de la plage des numéros de port pouvant être attribués aux processus de service d'application exécutés sur ce nœud. Le numéro par défaut est 6014.
    Numéro de port maximal
    Plus grand numéro de port de la plage des numéros de port pouvant être attribués aux processus de service d'application exécutés sur ce nœud. Le numéro par défaut est 6114.
  39. Indiquez si vous souhaitez configurer une base de données sécurisée. Appuyez sur 1 pour configurer une base de données sécurisée, ou sur 2 pour ignorer l'étape.
  40. Pour configurer les informations de connexion JDBC, appuyez sur 1 et entrez les paramètres de JDBC. Appuyez sur 2 pour ignorer la configuration de la connexion JDBC.
  41. Choisissez le type de base de données pour le référentiel modèle, et saisissez les informations d'identification, y compris l'ID et le mot de passe de l'utilisateur.
  42. Configurez éventuellement la connexion JDBC et ses paramètres.
  43. Saisissez les informations suivantes : nom du service de référentiel modèle, nom du service d'intégration de données et numéro de port du service d'intégration de données si vous ne souhaitez pas utiliser la valeur par défaut.
    OptionDescription
    Nom MRSNom du service de référentiel modèle.
    Nom DISNom du service d'intégration de données.
    Type de protocole HTTPProtocole de sécurité que le service d'intégration de données utilise.
    PortNuméro de port.
    Vous voyez des messages sur la création du service de référentiel modèle et du service d'intégration de données.
Le résumé post-installation indique si l'installation est réussie. Vous pouvez visualiser les fichiers journaux de l'installation pour obtenir plus d'informations sur les tâches effectuées par le programme d'installation et pour voir les propriétés de configuration des composants installés.


Mis à jour May 17, 2019


Explore Informatica Network