Inhaltsverzeichnis

Search

  1. Vorwort
  2. Informatica Developer
  3. Das Modellrepository
  4. Suchvorgänge in Informatica Developer
  5. Verbindungen
  6. Einfachdatei-Datenobjekte
  7. Logische Datenansicht
  8. Anzeigen von Daten
  9. Anwendungsbereitstellung
  10. Objekt-Import und -Export
  11. Datentypreferenz
  12. Tastenkombinationen
  13. Verbindungseigenschaften

Developer-Tool-Handbuch

Developer-Tool-Handbuch

Informatica Data Quality und Profiling

Informatica Data Quality und Profiling

Verwenden Sie die Datenqualitätsfunktionen im Developer Tool, um den Inhalt und die Struktur Ihrer Daten zu analysieren und die Daten gemäß den Bedürfnissen Ihres Unternehmens besser nutzen zu können.
Verwenden Sie das Developer Tool zum Konzipieren und Durchführen von Prozessen, mit denen die folgenden Aufgaben durchgeführt werden können:
  • Profiling von Daten. Profiling macht den Inhalt und die Struktur Ihrer Daten erkennbar. Profiling ist ein wichtiger Schritt in jedem Datenprojekt, da hierdurch Stärken und Schwächen in Ihren Daten erkannt und Sie bei der Definition Ihres Projektplans unterstützt werden.
  • Erstellen von Scorecards, um die Datenqualität zu prüfen. Eine Scorecard ist eine grafische Darstellung der Qualitätsmessungen in einem Profil.
  • Standardisieren von Datenwerten. Standardisieren Sie Daten, um Fehler und Inkonsistenzen zu entfernen, die Sie finden, wenn Sie ein Profil ausführen. Sie können Variationen der Zeichensetzung, Formatierung und Rechtschreibung standardisieren. Sie können beispielsweise sicherstellen, dass die Werte für Stadt, Staat und Postleitzahl konsistent sind.
  • Daten parsen Beim Parsen wird ein aus mehreren Werten zusammengesetztes Feld gelesen und für jeden Wert in Abhängigkeit vom darin enthaltenen Informationstyp ein Feld erzeugt. Durch Parsen können Datensätzen auch Informationen hinzugefügt werden. Sie können zum Beispiel eine Parsing-Operation definieren, um zu Produktdaten Maßeinheiten hinzuzufügen.
  • Validieren von Postadressen. Die Adressvalidierung bewertet und verbessert die Genauigkeit und Zustellbarkeit Ihrer Postadressendaten. Die Adressvalidierung korrigiert Fehler in Adressen und komplettiert unvollständige Adressen, indem die Adressdatensätze mit Referenzdaten von nationalen Zustellern verglichen werden. Die Adressvalidierung kann auch Postinformationen hinzufügen, die die Postzustellung beschleunigen und die Zustellkosten reduzieren.
  • Nach doppelten Datensätzen suchen. Die Doppelanalyse berechnet den Ähnlichkeitsgrad zwischen Datensätzen, indem sie Daten aus einem oder mehreren Feldern in jedem Datensatz vergleicht. Sie wählen die zu analysierenden Felder sowie die Vergleichsstrategien, die auf die Daten angewendet werden sollen. Das Developer Tool ermöglicht zwei Typen von Doppelanalyse: Feld-Matching, das ähnliche ode duplizierte Datensätze erkennt, und Identitäts-Matching, das ähnliche oder duplizierte Identitäten in Datensatz-Daten erkennt.
  • Ausnahmenverwaltung. Eine Ausnahme ist ein Datensatz, der Datenqualiltätsprobleme enthält, die Sie von Hand korrigieren müssen. Sie können ein Mapping durchführen, um Ausnahmedatensätze zu finden, die noch in einem Datensatz enthalten sind, nachdem Sie andere Datenqualiltätsprozesse durchgeführt haben. Sie überprüfen und bearbeiten Ausnahmedatensätze im Analyst-Tool.
  • Erstellen von Referenzdatentabellen. Informatica stellt Referenzdaten zur Verfügung, die mehrere Typen von Datenqualitätsprozessen aufwerten können, darunter Standardisierung und Parsen. Sie können Referenztabellen mit Daten aus Profilergebnissen erstellen.
  • Erstellen und Durchführen von Datenqualitätsregeln. Informatica bietet Regeln, die Sie ausführen oder bearbeiten können, um Ihre Projektziele zu erreichen. Sie können Mapplets erstellen und diese als Regeln im Developer Tool validieren.
  • Zusammenarbeiten mit Informatica-Anwendern. Das Model Repository speichert Referenzdaten und Regeln, und dieses Repository steht für Benutzer des Developer Tool und des Analyst Tool zur Verfügung. Benutzer können in Projekten zusammenarbeiten, und in unterschiedlichen Stadien eines Projekts können unterschiedliche Benutzer den Eigentümerstatus für Objekte übernehmen.
  • Exportieren von Mappings an PowerCenter. Sie können Mappings in PowerCenter exportieren und ausführen. Sie können Mappings an PowerCenter exportieren, um die Metadaten für physische Datenintegration oder für die Erstellung von Internetdiensten zu verwenden.