Inhaltsverzeichnis

Search

  1. Preface
  2. Einführung in Umwandlungen
  3. Umwandlungsports
  4. Umwandlungs-Caches
  5. Adressvalidator-Umwandlung
  6. Aggregator-Umwandlung
  7. Assoziations-Umwandlung
  8. Ausnahmeumwandlung bei fehlerhaftem Datensatz
  9. Fallumwandlerumwandlung
  10. Klassifizierumwandlung
  11. Vergleichsumwandlung
  12. Konsolidierungsumwandlung
  13. Datenmaskierungsumwandlung
  14. Datenprozessor-Umwandlung
  15. Entscheidungsumwandlung
  16. Ausnahmeumwandlung bei dupliziertem Datensatz
  17. Ausdrucksumwandlung
  18. Filterumwandlung
  19. Umwandlung von hierarchisch in relational
  20. Java-Umwandlung
  21. Java-Umwandlungs-API-Referenz
  22. Java-Ausdrücke
  23. Joiner-Umwandlung
  24. Schlüsselgeneratorumwandlung
  25. Labeler-Umwandlung
  26. Lookup-Umwandlung
  27. Lookup-Caches
  28. Dynamischer Lookup-Cache
  29. Match-Umwandlung
  30. Match-Umwandlungen in der Feldanalyse
  31. Match-Umwandlungen in der Identitätsanalyse
  32. Merge-Umwandlung
  33. Normalizer-Umwandlung
  34. Parser-Umwandlung
  35. Python-Umwandlung
  36. Rang-Umwandlung
  37. Leseumwandlung
  38. Relational-in-hierarchisch-Umwandlung
  39. REST-Webdienst-Verbraucher-Umwandlung
  40. Router-Umwandlung
  41. Sequenzgeneratorumwandlung
  42. Sortierer-Umwandlung
  43. SQL-Umwandlung
  44. Standardisierungs-Umwandlung
  45. Union-Umwandlung
  46. Update-Strategie-Umwandlung
  47. Web-Dienst-Verbraucher-Umwandlung
  48. Parsen von Webdienst-SOAP-Meldungen
  49. Generieren von Webdienst-SOAP-Meldungen
  50. Umwandlung für gewichteten Durchschnitt
  51. Schreibumwandlung
  52. Umwandlungs-Delimiter

Developer Transformation Guide

Developer Transformation Guide

Einsatz der Parserumwandlung

Einsatz der Parserumwandlung

Verwenden Sie die Parserumwandlung, wenn die Datenfelder in einer Spalte mehr als einen Informationstyp enthalten und die Feldwerte in neue Spalten verschoben werden sollen. Mit der Parserumwandlung können Sie neue Spalten für jeden Informationstyp in einem Datensatz erstellen.
Die folgenden Beispiele beschreiben bestimmte Arten struktureller Änderungen, die Sie mit einer Parserumwandlung durchführen können.
Erstellen neuer Spalten für Kontaktdaten
Sie können eine Datenstruktur erstellen, die Namensdaten aus einer einzelnen Spalte in mehrere Spalten parst. Sie können beispielsweise Spalten für Begrüßungen, Vornamen, zweite Vornamen und Nachnamen erstellen.
Sie konfigurieren die Umwandlung mit einem probabilistischen Modell, das die Strukturen der Personennamen auf dem Eingabeport darstellt. Sie verwenden eine Stichprobe der Eingabeportdaten, um das Modell zu definieren.
Sie erstellen eine Token-Parsing-Strategie, die ein probabilistisches Modell auf den Eingabeport anwendet und die Namenwerte in neue Spalten schreibt. Die Umwandlung schreibt die Namenwerte basierend auf der Position jedes Werts im Eingabestring und dem Namenstyp, den der Wert repräsentiert, in die neuen Spalten.
Außerdem können Sie eine musterbasierte Parsing-Strategie zum Parsen von Kontaktdaten verwenden. Definieren Sie beim Konfigurieren einer musterbasierten Parsing-Strategie die Muster, die die Strukturen der Namen auf dem Eingabeport darstellen.
Erstellen von Adressspalten
Sie können eine Datenstruktur erstellen, die eine einzelne Spalte mit Adressdaten in mehrere Spalten parst, die eine zustellfähige Adresse beschreiben.
Konfigurieren Sie die Umwandlung mit Referenztabellen, die erkennbare Adresselemente enthalten, wie z. B. Postleitzahlen sowie Namen von Bundesstaaten und Städten. Erstellen Sie eine Token-Parsing-Strategie, die jedes Adresselement auf einen neuen Port schreibt.
Sie können eine Referenztabelle nicht verwenden, um Straßenadressdaten aus einem Eingabestring zu parsen, da Straßenname und Nummer zu allgemein sind, um in einer Referenztabelle erfasst zu werden. Sie können jedoch den Überlaufport verwenden, um diese Daten zu erfassen. Wenn Sie alle Stadt-, Bundesstaat- und Postleitzahlendaten aus einer Adresse geparst haben, enthalten die verbleibenden Daten Straßeninformationen.
Verwenden Sie zum Beispiel eine Token-Parsing-Strategie, um die folgende Adresse in Adresselemente aufzuteilen:
123 MAIN ST NW STE 12 ANYTOWN NY 12345
Die Parsing-Strategie kann die Adresselemente in die folgenden Spalten schreiben:
Spaltenname
Daten
Überlauf
123 MAIN ST NW STE 12
Stadt
Beliebige Stadt
Bundesstaat
NY
PLZ
12345
Erstellen von Produktdatenspalten
Sie können eine Datenstruktur erstellen, die eine einzelne Spalte mit Produktdaten in mehrere Spalten parst, die die Details des Produktbestands beschreiben.
Konfigurieren Sie die Umwandlung mit Tokensätzen, die Bestandselemente enthalten, z. B. Maß, Farbe und Gewicht. Erstellen Sie eine Token-Parsing-Strategie, die jedes Bestandselement auf einen neuen Port schreibt.
Verwenden Sie zum Beispiel eine Token-Parsing-Strategie, um die folgende Farbbeschreibung in getrennte Bestandselemente aufzuteilen:
500ML Red Matt Exterior
Die Parsing-Strategie kann die Adresselemente in die folgenden Spalten schreiben:
Spaltenname
Daten
Größe
500ML
Farbe
Rot
Stil
Matt
Außenfarbe
J