Utilisez les fonctions de qualité des données de l'outil Developer tool pour analyser le contenu et la structure de vos données et les améliorer afin de répondre aux besoins de votre entreprise.
Utilisez l'outil Developer tool pour concevoir et exécuter des processus qui réalisent les objectifs suivants :
Profilez les données. Le profilage révèle le contenu et la structure de vos données. Le profilage est une étape clé de tous les projets de données, car il permet d'identifier les points forts et les points faibles de vos données, tout en vous aidant à définir un plan de projet.
Créer des fiches d'évaluation pour examiner la qualité des données. Une fiche d'évaluation est une représentation graphique des mesures de qualité dans un profil.
Normaliser les valeurs des données. Normalisez les données pour éliminer les erreurs et les incohérences détectées lors de l'exécution d'un profil. Vous pouvez normaliser les variations de ponctuation, de formatage et d'orthographe. Par exemple, vous pouvez vous assurer que les valeurs de ville, d'état et de code postal sont cohérentes.
Analyser les données. L'analyse lit un champ composé de plusieurs valeurs et en crée un nouveau pour chaque valeur, en fonction du type d'informations qu'il contient. L'analyse peut également ajouter des informations aux enregistrements. Vous pouvez par exemple définir une opération d'analyse pour ajouter des unités de mesure aux données produit.
Valider les adresses postales. La validation des adresses évalue et améliore l'exactitude et la possibilité de livraison de vos données d'adresse postale. La validation des adresses corrige les erreurs dans les adresses et complète les adresses partielles en comparant les enregistrements d'adresse avec des données de référence provenant de transporteurs postaux nationaux. La validation des adresses peut aussi ajouter des informations postales qui accélèrent la distribution du courrier tout en réduisant les coûts associés.
Rechercher les enregistrements dupliqués. L'analyse de doublon calcule le degré de similarité entre les enregistrements en comparant les données d'un ou plusieurs champs dans chaque enregistrement. Vous pouvez sélectionner les champs à analyser, puis les stratégies de comparaison à appliquer aux données. L'outil Developer tool active deux types d'analyse de doublon :
- la correspondance de champ, qui identifie des enregistrements similaires ou dupliqués,
- la correspondance d'identité, qui identifie les identités similaires ou dupliquées dans les données des enregistrements.
Gérer les exceptions. Une exception est un enregistrement qui contient des problèmes de qualité de données que vous pouvez corriger manuellement. Vous pouvez exécuter un mappage pour capturer tout enregistrement d'exception qui reste dans un jeu de données après l'exécution d'un autre processus de qualité de données. Vous pouvez vérifier et modifier les enregistrements d'exception dans l'outil Analyst tool.
Créer des tables de données de référence. Informatica fournit des données de référence qui peuvent améliorer plusieurs types de processus de qualité de données, notamment la normalisation et l'analyse. Vous pouvez créer des tables de référence à l'aide de données issues de résultats de profil.
Créer et exécuter des règles de qualité des données. Informatica fournit des règles que vous pouvez exécuter ou modifier pour les faire correspondre aux objectifs de votre projet. Vous pouvez créer des mapplets et les valider en tant que règles dans l'outil Developer tool.
Collaborer avec les utilisateurs d'Informatica. Le référentiel modèle stocke les données de référence et les règles. Ce référentiel est disponible pour les utilisateurs de l'outil Developer tool et de l'outil Analyst tool. Les utilisateurs peuvent collaborer sur des projets et différents utilisateurs peuvent s'approprier des objets à différentes phases d'un projet.
Utilisez l'outil Developer tool ou la commande infacmd pour l'importation de mappages depuis PowerCenter ou l'exportation des mappages vers PowerCenter afin de réutiliser les métadonnées.
Pour importer les données depuis PowerCenter dans le référentiel modèle, effectuez les étapes suivantes :
Exportez les objets PowerCenter dans un fichier à l'aide du client PowerCenter ou à l'aide de la commande suivante :
pmrep ExportObject
Convertissez le fichier d'exportation en fichier de référentiel modèle à l'aide de la commande suivante :
infacmd ipc importFromPC
Importez les objets à l'aide de l'outil Developer tool ou à l'aide de la commande suivante :
infacmd tools importObjects
Pour exporter les données depuis le référentiel modèle dans le référentiel PowerCenter, effectuez les étapes suivantes :
Exportez les objets du référentiel modèle dans un fichier à l'aide de l'outil Developer tool ou à l'aide de la commande suivante :
infacmd tools ExportObjects
Ou, vous pouvez directement exécuter
infacmd ipc ExportToPC
pour effectuer l'exportation.
Convertissez le fichier d'exportation en fichier PowerCenter à l'aide de la commande suivante :
infacmd ipc ExporttoPC
Importez les objets à l'aide de PowerCenter ou à l'aide de la commande suivante :