Table des matières

Search

  1. Présentation de l'installation
  2. Avant l'installation Enterprise Data Catalog
  3. Installation d'Enterprise Data Catalog
  4. Après l'installation d'Enterprise Data Catalog
  5. Désinstallation
  6. Dépannage
  7. Démarrage et arrêt des services d'Enterprise Data Catalog
  8. Supprimer l'accès sudo après la création d'un cluster incorporé
  9. Configurer un répertoire journal personnalisé pour Ambari
  10. Configurer Enterprise Data Catalog pour un cluster avec WANdisco Fusion activé
  11. Configurer Informatica Custom Service Descriptor
  12. Créer des utilisateurs et des groupes d'utilisateurs personnalisés pour les services déployés dans un cluster incorporé
  13. Configurer des ports personnalisés pour les applications Hadoop

Guide d'installation et de configuration d'Enterprise Data Catalog

Guide d'installation et de configuration d'Enterprise Data Catalog

Création des services d'application Enterprise Data Catalog à l'aide du programme d'installation

Création des services d'application Enterprise Data Catalog à l'aide du programme d'installation

Effectuez les étapes suivantes pour créer les services d'application à l'aide du programme d'installation après avoir installé Enterprise Data Catalog :
  1. Connectez-vous à la machine à l'aide d'un compte utilisateur système.
  2. Fermez toutes les applications en cours d'exécution sur la machine.
  3. Sur une ligne de commande shell, exécutez la commande ./install.sh pour démarrer le programme d'installation.
  4. Appuyez sur y pour poursuivre l'installation.
  5. Appuyez sur 3 pour sélectionner l'option d'installation des services d'application pour Enterprise Data Catalog ou Enterprise Data Preparation.
  6. Appuyez sur 2 pour accepter les conditions générales.
  7. Appuyez sur 2 pour accepter de poursuivre l'installation de produits Big Data.
  8. Appuyez sur 1 pour configurer les services pour Enterprise Data Catalog.
  9. Appuyez sur 1 pour confirmer que la dernière version des services Enterprise Data Catalog n'est pas installée.
  10. Saisissez le répertoire où vous avez installé Enterprise Data Catalog et appuyez sur Entrée.
  11. Saisissez les informations de domaine suivantes que vous aviez configurées quand vous avez installé Enterprise Data Catalog :
    1. Nom du domaine. Indiquez le nom du Domaine Informatica que vous avez créé et appuyez sur Entrée.
    2. Nom du nœud. Indiquez le nom du nœud que vous avez créé sur la machine où vous avez installé Enterprise Data Catalog et appuyez sur Entrée.
    3. Mot de passe d'utilisateur du domaine. Indiquez le mot de passe que vous avez configuré pour l'administrateur de Domaine Informatica et appuyez sur Entrée.
  12. Appuyez sur 1 pour confirmer que vous désirez créer le Service de référentiel modèle et le Service d'intégration de données.
  13. Appuyez sur 1 si vous désirez créer la Surveillance de Service de référentiel modèle pour surveiller les statistiques du Domaine Informatica.
  14. Appuyez sur 2 pour spécifier que vous ne désirez pas créer de configuration de cluster. Vous devez créer une configuration de cluster dans le domaine Informatica si vous prévoyez de configurer les services Enterprise Data Preparation.
  15. Appuyez sur 1 si vous désirez créer une connexion à l'entrepôt de profilage.
  16. Appuyez sur 1 pour configurer le service de gestion de contenu.
  17. Vous devez créer le service de cluster Informatica si vous déployez Enterprise Data Catalog sur un cluster incorporé. Appuyez sur 1 si vous désirez configurer le service de cluster Informatica.
    Passez en revue les points suivants pour décider si vous désirez créer le service de cluster Informatica.
    • Créer le service de cluster Informatica. Le programme d'installation crée le service de cluster Informatica.
    • Sélectionnez l'option pour spécifier si vous désirez créer le service de cluster Informatica. Le programme d'installation vous invite à spécifier si vous désirez associer un service de cluster Informatica au service de catalogue. Si vous sélectionnez cette option, le programme d'installation ne crée pas de nouveau service de cluster Informatica. Le programme d'installation vous invite à associer un service de cluster Informatica au service de catalogue.
    • Sélectionnez les options pour spécifier que vous ne voulez pas créer de service de cluster Informatica et associer un service de cluster Informatica existant au service de catalogue. Le programme d'installation ne crée pas le service de cluster Informatica et passe à la création du service de catalogue.
  18. Appuyez sur 1 si vous désirez configurer le service de catalogue.
  19. Effectuez les étapes des sections suivantes pour créer les services d'application.

Création du service de référentiel modèle

Fournissez les informations suivantes pour le service de référentiel modèle :
  1. Nom du service de référentiel modèle.
  2. Nom du nœud sur lequel doit d'exécuter le service de référentiel modèle.
  3. Licence à associer au service de référentiel modèle.
  4. Sélectionnez la base de données que vous souhaitez configurer pour le référentiel modèle à partir des options suivantes :
    • Oracle
    • SQL Server
    • DB2
    La valeur par défaut est Oracle.
  5. Saisissez le nom d'utilisateur pour accéder à la base de données dans le paramètre Database user ID et appuyez sur Entrée. Le nom par défaut est admin.
  6. Saisissez le mot de passe pour le nom d'utilisateur dans le paramètre User password et appuyez sur Entrée.
  7. Appuyez sur 1 si la base de données est sécurisée avec SSL.
    Si vous avez sélectionné l'option pour spécifier que SSL est activé sur la base de données, fournissez les paramètres suivants :
    Paramètres de base de données sécurisée Description
    EncryptionMethod Indique si les données sont cryptées lorsqu'elles sont transmises sur le réseau. Ce paramètre doit être défini pour SSL.
    ValidateServerCertificate Indique si Informatica valide le certificat envoyé par le serveur de base de données.
    Si ce paramètre est défini sur True, Informatica valide le certificat envoyé par le serveur de base de données. Si vous spécifiez le paramètre HostNameInCertificate, Informatica valide également le nom d'hôte dans le certificat.
    Si ce paramètre est défini sur False, Informatica ne valide pas le certificat envoyé par le serveur de base de données. Informatica ignore les informations de truststore que vous spécifiez.
    HostNameInCertificate Nom d'hôte de la machine qui héberge la base de données sécurisée. Si vous spécifiez un nom d'hôte, Informatica valide le nom d'hôte inclus dans la chaîne de connexion avec le nom d'hôte dans le certificat SSL.
    cryptoProtocolVersion Indique le protocole cryptographique à utiliser pour la connexion à une base de données sécurisée. Vous pouvez définir le paramètre sur cryptoProtocolVersion=TLSv1.1 ou cryptoProtocolVersion=TLSv1.2 selon le protocole cryptographique utilisé par le serveur de base de données.
    TrustStore Chemin et nom du fichier truststore contenant le certificat SSL de la base de données.
    Si vous n'incluez pas le chemin du fichier truststore, Informatica recherche ce fichier dans le répertoire par défaut suivant : <Répertoire d'installation Informatica>/tomcat/bin
    TrustStorePassword Mot de passe du fichier truststore de la base de données sécurisée.
  8. Appuyez sur 1 pour spécifier l'URL JDBC pour la connexion à la base de données.
  9. Spécifiez l'adresse de la base de données dans le format suivant pour le paramètre Database address : <Nom de domaine complet de l'hôte>:<port>
  10. Spécifiez le nom du service de la base de données dans le format suivant pour le paramètre Database service name : <Nom de domaine complet du service>
  11. Appuyez sur 1 pour spécifier que vous désirez configurer les paramètres JDBC.
  12. Spécifiez les valeurs requises pour les paramètres ou appuyez sur Entrée pour appliquer les valeurs par défaut. Appuyez sur Entrée pour conserver les valeurs par défaut.
    Utilisez la syntaxe suivante pour la chaîne de connexion du type de base de données sélectionné :
    Type de base de données Syntaxe de la chaîne de connexion
    IBM DB2 jdbc:informatica:db2://<nom_hôte>:<numéro_port>;DatabaseName=<nom_basededonnées>;BatchPerformanceWorkaround=true;DynamicSections=3000
    Microsoft SQL Server
    • Microsoft SQL Server qui utilise l'instance par défaut
      jdbc:informatica:sqlserver://<nom_hôte>:<numéro_port>;DatabaseName=<nom_basededonnées>;SnapshotSerializable=true
    • Microsoft SQL Server qui utilise une instance nommée
      jdbc:informatica:sqlserver://<nom_hôte>\<nom_instance_nommée>;DatabaseName=<nom_basededonnées>;SnapshotSerializable=true
    Oracle jdbc:informatica:oracle://<nom_hôte>:<numéro_port>;SID=<nom_basededonnées>;MaxPooledStatements=20;CatalogOptions=0;BatchPerformanceWorkaround=true
    Le programme d'installation valide le nom du nœud et la licence, puis crée le service de référentiel modèle. Le programme d'installation passe à la création du service d'intégration de données.

Création du service d'intégration de données

Fournissez les informations suivantes pour le service d'intégration de données :
  1. Nom du service d'intégration de données.
  2. Nom du nœud sur lequel doit d'exécuter le service d'intégration de données.
  3. Licence à associer au service d'intégration de données.
  4. Le nom du service de référentiel modèle que vous voulez associer au service d'intégration de données.
  5. Spécifiez le protocole que vous souhaitez utiliser pour le service à partir des options suivantes :
    • http
    • https
    • http&https
      Si vous sélectionnez https ou http&https comme protocole pour le service, fournissez les informations suivantes :
      1. Port HTTPS. La valeur par défaut est 18095.
      2. Spécifiez le certificat SSL que vous désirez utiliser pour sécuriser le service d'intégration de données. Vous pouvez utiliser les certificats SSL par défaut dans les keystore et truststore par défaut ou utiliser des certificats SSL personnalisés. Si vous choisissez des certificats SSL personnalisés, spécifiez le chemin qui inclut le nom des fichiers keystore et truststore et les mots de passe pour accéder à ces fichiers.
  6. Appuyez sur 1 si vous désirez que le service d'intégration de données utilise le moteur Spark pour exécuter des mappages Sqoop ou traiter des transformations Java.
Le programme d'installation valide le nom du nœud et la licence, puis crée et active le Service d'intégration de données. Le programme d'installation passe à la création de l'entrepôt de profilage.

Configurer l'entrepôt de profilage

Fournissez les informations suivantes pour configurer la base de données pour l'entrepôt de profilage :
  1. Nom du Service d'intégration de données que vous désirez associer à l'entrepôt de profilage.
  2. Sélectionnez la base de données que vous souhaitez configurer pour l'entrepôt de profilage à partir des options suivantes :
    • Oracle
    • SQL Server
    • DB2
    La valeur par défaut est Oracle.
  3. Saisissez le nom d'utilisateur pour accéder à la base de données dans le paramètre Database user ID et appuyez sur Entrée. Le nom par défaut est admin.
  4. Saisissez le mot de passe pour le nom d'utilisateur dans le paramètre User password et appuyez sur Entrée.
  5. Appuyez sur 1 si la base de données est sécurisée avec SSL.
    Si vous avez sélectionné l'option pour spécifier que SSL est activé sur la base de données, fournissez les paramètres suivants :
    Paramètres de base de données sécurisée Description
    EncryptionMethod Indique si les données sont cryptées lorsqu'elles sont transmises sur le réseau. Ce paramètre doit être défini pour SSL.
    ValidateServerCertificate Indique si Informatica valide le certificat envoyé par le serveur de base de données.
    Si ce paramètre est défini sur True, Informatica valide le certificat envoyé par le serveur de base de données. Si vous spécifiez le paramètre HostNameInCertificate, Informatica valide également le nom d'hôte dans le certificat.
    Si ce paramètre est défini sur False, Informatica ne valide pas le certificat envoyé par le serveur de base de données. Informatica ignore les informations de truststore que vous spécifiez.
    HostNameInCertificate Nom d'hôte de la machine qui héberge la base de données sécurisée. Si vous spécifiez un nom d'hôte, Informatica valide le nom d'hôte inclus dans la chaîne de connexion avec le nom d'hôte dans le certificat SSL.
    cryptoProtocolVersion Indique le protocole cryptographique à utiliser pour la connexion à une base de données sécurisée. Vous pouvez définir le paramètre sur cryptoProtocolVersion=TLSv1.1 ou cryptoProtocolVersion=TLSv1.2 selon le protocole cryptographique utilisé par le serveur de base de données.
    TrustStore Chemin et nom du fichier truststore contenant le certificat SSL de la base de données.
    Si vous n'incluez pas le chemin du fichier truststore, Informatica recherche ce fichier dans le répertoire par défaut suivant : <Répertoire d'installation Informatica>/tomcat/bin
    TrustStorePassword Mot de passe du fichier truststore de la base de données sécurisée.
  6. Appuyez sur 1 pour spécifier l'URL JDBC pour la connexion à la base de données.
  7. Spécifiez l'adresse de la base de données dans le format suivant pour le paramètre Database address : <Nom de domaine complet de l'hôte>:<port>
  8. Spécifiez le nom du service de la base de données dans le format suivant pour le paramètre Database service name : <Nom de domaine complet du service>
  9. Appuyez sur 1 pour spécifier que vous désirez configurer les paramètres JDBC.
  10. Spécifiez les valeurs requises pour les paramètres ou appuyez sur Entrée pour appliquer les valeurs par défaut. Appuyez sur Entrée pour conserver les valeurs par défaut.
    Utilisez la syntaxe suivante pour la chaîne de connexion du type de base de données sélectionné :
    Type de base de données Syntaxe de la chaîne de connexion
    IBM DB2 jdbc:informatica:db2://<nom_hôte>:<numéro_port>;DatabaseName=<nom_basededonnées>;BatchPerformanceWorkaround=true;DynamicSections=3000
    Microsoft SQL Server
    • Microsoft SQL Server qui utilise l'instance par défaut
      jdbc:informatica:sqlserver://<nom_hôte>:<numéro_port>;DatabaseName=<nom_basededonnées>;SnapshotSerializable=true
    • Microsoft SQL Server qui utilise une instance nommée
      jdbc:informatica:sqlserver://<nom_hôte>\<nom_instance nommée>;DatabaseName=<nom_basededonnées>;SnapshotSerializable=true
    Oracle jdbc:informatica:oracle://<nom_hôte>:<numéro_port>;SID=<nom_basededonnées>;MaxPooledStatements=20;CatalogOptions=0;BatchPerformanceWorkaround=true
Le programme d'installation crée l'entrepôt de profilage de données et passe à la création du service de gestion de contenu.

Création du service de gestion de contenu

Fournissez les informations suivantes pour créer le service de gestion de contenu :
  1. Nom du service de référentiel modèle que vous souhaitez associer au service.
  2. Nom du service d'intégration de données que vous souhaitez associer au service.
  3. Nom du nœud sur lequel doit d'exécuter le service de gestion de contenu.
  4. Licence à associer au service de gestion de contenu.
  5. Nom du service de gestion de contenu.
  6. Spécifiez le protocole que vous souhaitez utiliser pour le service à partir des options suivantes :
    • http
    • https
    Si vous sélectionnez https comme protocole pour le service, fournissez les informations suivantes :
    1. Port HTTPS. La valeur par défaut est 17466.
    2. Spécifiez le certificat SSL que vous désirez utiliser pour sécuriser le service de gestion de contenu. Vous pouvez utiliser les certificats SSL par défaut dans le keystore par défaut ou utiliser des certificats SSL personnalisés. Si vous choisissez des certificats SSL personnalisés, spécifiez le chemin qui inclut le nom du fichier keystore et le mot de passe pour accéder à ce fichier.
  7. Effectuez les étapes suivantes pour configurer la base de données pour le service de gestion de contenu :
  8. Sélectionnez la base de données que vous souhaitez configurer pour le service de gestion de contenu à partir des options suivantes :
    • Oracle
    • SQL Server
    • DB2
    La valeur par défaut est Oracle.
  9. Saisissez le nom d'utilisateur pour accéder à la base de données dans le paramètre Database user ID et appuyez sur Entrée. Le nom par défaut est admin.
  10. Saisissez le mot de passe pour le nom d'utilisateur dans le paramètre User password et appuyez sur Entrée.
  11. Appuyez sur 1 si la base de données est sécurisée avec SSL.
    Si vous avez sélectionné l'option pour spécifier que SSL est activé sur la base de données, fournissez les paramètres suivants :
    Paramètres de base de données sécurisée Description
    EncryptionMethod Indique si les données sont cryptées lorsqu'elles sont transmises sur le réseau. Ce paramètre doit être défini pour SSL.
    ValidateServerCertificate Indique si Informatica valide le certificat envoyé par le serveur de base de données.
    Si ce paramètre est défini sur True, Informatica valide le certificat envoyé par le serveur de base de données. Si vous spécifiez le paramètre HostNameInCertificate, Informatica valide également le nom d'hôte dans le certificat.
    Si ce paramètre est défini sur False, Informatica ne valide pas le certificat envoyé par le serveur de base de données. Informatica ignore les informations de truststore que vous spécifiez.
    HostNameInCertificate Nom d'hôte de la machine qui héberge la base de données sécurisée. Si vous spécifiez un nom d'hôte, Informatica valide le nom d'hôte inclus dans la chaîne de connexion avec le nom d'hôte dans le certificat SSL.
    cryptoProtocolVersion Indique le protocole cryptographique à utiliser pour la connexion à une base de données sécurisée. Vous pouvez définir le paramètre sur cryptoProtocolVersion=TLSv1.1 ou cryptoProtocolVersion=TLSv1.2 selon le protocole cryptographique utilisé par le serveur de base de données.
    TrustStore Chemin et nom du fichier truststore contenant le certificat SSL de la base de données.
    Si vous n'incluez pas le chemin du fichier truststore, Informatica recherche ce fichier dans le répertoire par défaut suivant : <Répertoire d'installation Informatica>/tomcat/bin
    TrustStorePassword Mot de passe du fichier truststore de la base de données sécurisée.
  12. Appuyez sur 1 pour spécifier l'URL JDBC pour la connexion à la base de données.
  13. Spécifiez l'adresse de la base de données dans le format suivant pour le paramètre Database address : <Nom de domaine complet de l'hôte>:<port>
  14. Spécifiez le nom du service de la base de données dans le format suivant pour le paramètre Database service name : <Nom de domaine complet du service>
  15. Appuyez sur 1 pour spécifier que vous désirez configurer les paramètres JDBC.
  16. Spécifiez les valeurs requises pour les paramètres ou appuyez sur Entrée pour appliquer les valeurs par défaut. Appuyez sur Entrée pour conserver les valeurs par défaut.
    Utilisez la syntaxe suivante pour la chaîne de connexion du type de base de données sélectionné :
    Type de base de données Syntaxe de la chaîne de connexion
    IBM DB2 jdbc:informatica:db2://<nom_hôte>:<numéro_port>;DatabaseName=<nom_basededonnées>;BatchPerformanceWorkaround=true;DynamicSections=3000
    Microsoft SQL Server
    • Microsoft SQL Server qui utilise l'instance par défaut
      jdbc:informatica:sqlserver://<nom_hôte>:<numéro_port>;DatabaseName=<nom_basededonnées>;SnapshotSerializable=true
    • Microsoft SQL Server qui utilise une instance nommée
      jdbc:informatica:sqlserver://<nom_hôte>\<nom_instance_nommée>;DatabaseName=<nom_basededonnées>;SnapshotSerializable=true
    Oracle jdbc:informatica:oracle://<nom_hôte>:<numéro_port>;SID=<nom_basededonnées>;MaxPooledStatements=20;CatalogOptions=0;BatchPerformanceWorkaround=true
Le programme d'installation crée et active le service de gestion de contenu et passe à la configuration du cluster et des options du service d'application.

Configuration du cluster et des options du service d'application

Effectuez les étapes suivantes pour configurer le cluster et les options du service d'application :
  1. Appuyez sur 1 si vous désirez que le programme d'installation configure Apache ZooKeeper, YARN et HDFS en fonction des propriétés que vous fournissez.
  2. Sélectionnez le type de cluster parmi les options suivantes :
    • Hortonworks
    • Cloudera
    • Azure HDInsight
  3. Spécifiez si le cluster utilise l'authentification Kerberos.
  4. Spécifiez si le cluster est activé pour SSL.

Configuration du service de cluster Informatica

Si vous installez Enterprise Data Catalog sur un cluster incorporé, fournissez les informations suivantes pour configurer le service de cluster Informatica :
  1. Nom du nœud sur lequel doit d'exécuter le service de cluster Informatica.
  2. Licence à associer au service de cluster Informatica.
  3. Nom d'utilisateur pour le serveur Apache Ambari. La valeur par défaut est root.
  4. Nom du service de cluster Informatica.
  5. Nom d'hôte pour la passerelle de cluster Informatica Hadoop.
  6. Liste séparée par des virgules de nœuds Hadoop où sont exécutés les agents Apache Ambari.
  7. Numéro de port du serveur Apache Ambari. La valeur par défaut est 9075.
  8. Numéro de port de la passerelle de cluster Informatica Hadoop. La valeur par défaut est 8080.
  9. Spécifiez si vous désirez changer le mot de passe par défaut pour Ambari.
  10. Fournissez les propriétés suivantes si vous désirez activer SSL pour le cluster :
    1. Port HTTPS du service de cluster Informatica. La valeur par défaut est 7500.
    2. Appuyez sur 1 si vous désirez utiliser le keystore par défaut généré par le programme d'installation.
    3. Si vous choisissez d'utiliser un fichier keystore généré par le programme d'installation, ce dernier crée un fichier keystore auto-signé nommé Default.keystore à l'emplacement suivant : <Répertoire d'installation Informatica>/tomcat/conf/ Ou sinon, vous pouvez utiliser un fichier keystore avec un certificat auto-signé ou un certificat signé par une autorité de certification. Si vous ne prévoyez pas d'utiliser le fichier keystore généré par le programme d'installation, vérifiez que vous fournissez les certificats SSL dans un format PEM et dans des fichiers keystore Java (JKS). Informatica requiert des noms de fichier de certificat SSL spécifiques pour le domaine Informatica. Vous devez utiliser les mêmes certificats SSL pour tous les nœuds du domaine. Stockez les fichiers truststore et keystore dans un répertoire accessible à tous les nœuds du domaine et spécifiez le même répertoire de fichiers keystore et truststore pour tous les nœuds d'un même domaine.
    4. Spécifiez l'emplacement du fichier truststore accessible par tous les nœuds du domaine et appuyez sur Entrée. La valeur par défaut est /opt/ssl.
  11. Appuyez sur 2 si vous désirez spécifier un répertoire pour stocker les fichiers journaux HDFS, YARN et ZooKeeper, ainsi que les répertoires de données.
  12. Si vous avez sélectionné 2 à l'étape précédente, spécifiez le chemin d'accès au répertoire où vous désirez stocker les fichiers journaux et appuyez sur Entrée.
  13. Le programme d'installation crée le service de cluster Informatica et passe à la création du service de catalogue.

Configuration du service de catalogue

Fournissez les informations suivantes pour configurer le service de catalogue :
  1. Nom du service de catalogue.
  2. Nom du service de référentiel modèle que vous désirez associer au service de catalogue.
  3. Nom du nœud sur lequel doit s'exécuter le service de catalogue.
  4. Dans le cas où Enterprise Data Catalog a été déployé sur un cluster incorporé, si vous avez sélectionné les options pour associer le service de cluster Informatica au service de catalogue, fournissez le nom du service de cluster Informatica.
  5. La licence que vous désirez associer au service de catalogue.
  6. L'URL de distribution Hadoop du cluster.
  7. Nom d'utilisateur pour accéder à l'URL de distribution Hadoop du cluster. Le nom par défaut est admin.
  8. Mot de passe pour accéder à l'URL de distribution Hadoop du cluster.
  9. Spécifiez les propriétés suivantes si vous avez déployé Enterprise Data Catalog sur un cluster existant :
    Propriété Description
    Nom du cluster. Si vous avez sélectionné Cloudera comme type de cluster, vous pouvez donner un nom au cluster.
    Nom du service HDFS pour la haute disponibilité S'applique au cluster existant hautement disponible. Spécifiez le nom de service HDFS.
    URI du planificateur du gestionnaire de ressources Yarn Valeur de l'URI du planificateur du gestionnaire de ressources Yarn.
    Si vous sélectionnez ClouderaManager ou Hortonworks comme distribution Hadoop pour un cluster existant, Enterprise Data Catalog identifie automatiquement les propriétés suivantes pour le type de distribution Hadoop :
    • URI du cluster ZooKeeper
    • URI du NameNode HDFS
    • URI du gestionnaire de ressources Yarn
    • URI HTTPS ou HTTP du gestionnaire de ressources Yarn
    • URI HTTP du serveur d'historique
    • Nom du service HDFS pour la haute disponibilité
    • URI du planificateur du gestionnaire de ressources Yarn
  10. Si vous avez déployé Enterprise Data Catalog sur un cluster Azure HDInsight, spécifiez les propriétés suivantes pour le service de catalogue :
    Propriété Description
    Type de cluster Cluster externe
    Distribution Hadoop HDInsight
    URL du cluster Nom d'hôte complet permettant d'accéder au cluster.
    Nom d'utilisateur de l'URL du cluster Nom d'utilisateur permettant d'accéder au cluster.
    Mot de passe de l'URL du cluster Mot de passe pour le nom d'utilisateur de l'URL du cluster.
    Après avoir créé le service de catalogue, configurez les propriétés personnalisées suivantes dans l'application Informatica Administrator du service de catalogue :
    Propriété personnalisée Description
    LdmCustomOptions.deployment.azure.account.key La clé pour authentifier le service de catalogue afin de se connecter au compte de stockage Azure. La valeur de la clé du compte de stockage Azure peut être chiffrée ou non chiffrée. Vous pouvez récupérer la valeur depuis la propriété fs.azure.account.key.<nom du compte de stockage> dans le fichier core-site.xml présent dans le cluster Azure HDInsight.
    LdmCustomOptions.deployment.azure.key.decryption.script.path Si la clé spécifiée dans la propriété LdmCustomOptions.deployment.azure.account.key est au format chiffré, vous pouvez utiliser le script shell de déchiffrement pour déchiffrer la clé à l'aide du certificat de clé. Vous devez vérifier que vous copiez le script shell de déchiffrement et le fichier de certificat de clé sur la machine du domaine (même chemin que la machine du cluster) avant d'activer le service de catalogue. Assurez-vous de conserver le chemin dans la machine du cluster Azure HDInsight pour les fichiers copiés dans la machine du domaine. La valeur de la propriété est l'emplacement du script shell de déchiffrement. Par exemple, /usr/lib/python2.7/dist-packages/hdinsight_common/decrypt.sh. Le fichier de certificat de clé, key_decryption_cert.prv, est présent dans le répertoire /usr/lib/hdinsight-common/certs/key_decryption_cert.prv du cluster Azure HDInsight.
    LdmCustomOptions.deployment.hdfs.default.fs Adresse du compte de stockage WASB auquel le service de catalogue doit se connecter. L'adresse comprend le nom du conteneur de stockage WASB avec le nom du compte de stockage. La valeur de la propriété est l'adresse WASB complète avec les noms du conteneur et du compte de stockage. Vous pouvez récupérer la valeur de la propriété depuis la propriété fs.defaultFS dans le fichier core-site.xml présent dans le cluster Azure HDInsight.
  11. Le nom du cluster de service.
  12. Fournissez les propriétés suivantes si vous désirez activer un accès sécurisé au service de catalogue :
    1. Fournissez le port HTTPS que vous désirez configurer pour le service de catalogue. La valeur par défaut est 9124.
    2. Appuyez sur 1 si vous désirez utiliser le keystore par défaut généré par le programme d'installation, sinon appuyez sur 2 pour utiliser un fichier keystore personnalisé.
      Si vous ne prévoyez pas d'utiliser le fichier keystore généré par le programme d'installation, vérifiez que vous fournissez les certificats SSL dans un format PEM et dans des fichiers keystore Java (JKS). Informatica requiert des noms de fichier de certificat SSL spécifiques pour le domaine Informatica. Vous devez utiliser les mêmes certificats SSL pour tous les nœuds du domaine. Stockez les fichiers truststore et keystore dans un répertoire accessible à tous les nœuds du domaine et spécifiez le même répertoire de fichiers keystore et truststore pour tous les nœuds d'un même domaine.
      Si vous avez sélectionné l'option pour utiliser un fichier keystore personnalisé, fournissez les informations suivantes :
      1. Chemin d'accès au fichier keystore.
      2. L'alias keystore.
      3. Mot de passe du fichier keystore.
      4. Mot de passe du keystore Solr.
  13. Sélectionnez la taille du chargement de métadonnées que vous désirez introduire dans le catalogue à partir des options suivantes :
    • démo
    • faible
    • moyenne
    • élevée


Mis à jour May 17, 2019


Explore Informatica Network