Inhaltsverzeichnis

Search

  1. Vorwort
  2. Einführung in die Datenumwandlung
  3. Datenprozessor-Umwandlung
  4. Assistent für Eingabe- und Ausgabeformate
  5. Relationale Eingabe und Ausgabe
  6. Verwenden des IntelliScript-Editors
  7. XMap
  8. Bibliotheken
  9. Schema-Objekt
  10. Eingabeaufforderung
  11. Skripte
  12. Parser
  13. Skriptports
  14. Dokumentprozessoren
  15. Formate
  16. Datenbehälter
  17. Anker
  18. Transformer
  19. Aktionen
  20. Serializer
  21. Mapper
  22. Lokatoren, Schlüssel und Indexierung
  23. Streamer
  24. Validatoren, Benachrichtigungen und Fehlerbehandlung
  25. Validierungsregeln
  26. Benutzerdefinierte Skriptkomponenten

Benutzerhandbuch

Benutzerhandbuch

Content

Content

Ein
Content
-Anker ruft Text aus dem Quelldokument ab. Der Parser sucht in einem definierten Bereich gemäß den festgelegten Suchkriterien und speichert den abgerufenen Text in einem Datenbehälter.
Die nachstehende Tabelle beschreibt die Eigenschaften des Ankers
Content
:
Eigenschaft
Beschreibung
allow_empty_values
Legt fest, ob der
Content
-Anker leer sein kann. Sie können eine der folgenden Optionen auswählen:
  • Ausgewählt. Der Eigenschaft
    data_holder
    wird ein leerer Wert zugewiesen.
  • Gelöscht. Leere Werte sind nicht zulässig.
allow_empty_values
muss unter folgenden Umständen ausgewählt werden:
  • Wenn der Anker mit
    value = LearnByExample
    konfiguriert ist und zwischen den Delimitern nichts ist
  • Wenn zwischen
    opening_marker
    und
    closing_marker
    nichts ist.
closing_marker
Definiert das Ende eines Bereichs, in dem der Parser nach dem
Content
-Anker sucht. Sie können eine der folgenden Optionen auswählen:
  • NewlineSearch. Das Ende des
    Content
    -Ankers ist das nächste Newline-Zeichen.
  • OffsetSearch. Das Ende des
    Content
    -Ankers ist die Anzahl der Zeichen, die in
    offset
    angegeben sind.
  • PatternSearch. Das Ende des
    Content
    -Ankers ruft den ersten Text ab, der mit einem angegebenen regulären Ausdruck übereinstimmt.
  • TextSearch. Das Ende des
    Content
    -Ankers ist ein festgelegter Textstring.
data_holder
Definiert einen Datenbehälter, in dem der
Content
-Anker den abgerufenen Text speichert.
direction
Eine Suchrichtung für den Anker innerhalb des Suchbereichs. Sie können eine der folgenden Optionen auswählen:
  • Zurück. Die Suche beginnt am Ende des Suchbereichs und findet die letzte Instanz des Ankers.
  • Vorwärtssuche. Die Suche beginnt am Anfang des Suchbereichs und findet die erste Instanz des Ankers.
Bei einem
Marker
-Anker können Sie dieses Verhalten mithilfe der Eigenschaft
count
ändern. Wenn beispielsweise
direction = backward
und
count = 2
ist, findet das Skript die vorletzte Instanz.
Standardwert ist "Vorwärtssuche". Weitere Informationen hierzu finden Sie unter So sucht der Parser Anker.
disable_XSD_type_search
Legt fest, ob der Parser nach Inhalten sucht, die mit dem Datentyp des Datenbehälters übereinstimmen. Sie können eine der folgenden Optionen auswählen:
  • Ausgewählt. Der Parser sucht ohne Berücksichtigung des Datentyps. Nachdem Transformer auf den Inhalt angewendet wurden und das Ergebnis nicht zum Datentyp passt, schlägt der Anker fehl.
  • Gelöscht. Der Parser sucht nach Inhalt, der mit dem Datentyp übereinstimmt.
Standardwert ist "Gelöscht". Weitere Informationen hierzu finden Sie unter Eingrenzen der Suchkriterien mit Datentypen.
disabled
Legt fest, ob die Komponente und alle zugehörigen untergeordneten Komponenten vom Skript ignoriert werden. Verwenden Sie diese Eigenschaft zum Testen, Debuggen und Ändern eines Skripts. Sie können eine der folgenden Optionen auswählen:
  • Ausgewählt. Das Skript ignoriert die Komponente.
  • Gelöscht. Das Skript wendet die Komponente an.
Standardmäßig ist die Eigenschaft deaktiviert.
ignore_default_transformers
Legt fest, ob der Parser die Standard-Transformer auf den Inhalt anwendet. Standardwert ist "Gelöscht".
Weitere Informationen hierzu finden Sie unter Übersicht über Transformer.
marking
Legt fest, ob ein Anker als Anfang des Suchbereichs für den danach folgenden Anker verwendet wird. Sie können eine der folgenden Optionen auswählen:
  • Anfangsposition. Setzt einen Referenzpunkt vor dem aktuellen Anker.
  • Endposition. Setzt einen Referenzpunkt hinter dem aktuellen Anker.
  • Vollständig. Setzt einen Referenzpunkt vor und hinter dem aktuellen Anker.
  • Keine. Es wird kein Referenzpunkt erstellt.
Weitere Informationen hierzu finden Sie unter So sucht der Parser Anker.
name
Eine beschreibende Kennzeichnung für die Komponente. Diese Kennzeichnung wird in der Protokolldatei sowie der
Ereignisansicht
angezeigt. Ermitteln Sie anhand der Eigenschaft
name
, welche Komponente das Ereignis verursacht hat.
on_fail
Die Aktion, die beim Ausfall der Komponente durchgeführt wird. Sie können eine der folgenden Optionen auswählen:
  • Gelöscht. Es wird keine Aktion ausgeführt.
  • CustomLog. Es wird in das Benutzerprotokoll geschrieben.
  • LogError. Eine Fehlermeldung wird in das Engine-Protokoll geschrieben.
  • LogInfo. Eine Informationsmeldung wird in das Engine-Protokoll geschrieben.
  • LogWarning. Eine Warnmeldung wird in das Engine-Protokoll geschrieben.
  • NotifyFailure. Eine Mitteilung wird gesendet.
Die Standardoption lautet „Gelöscht“. Weitere Informationen über die Behandlung von Komponentenfehlern finden Sie in Fehlerbehandlung.
opening_marker
Definiert den Beginn eines Bereichs, in dem der Parser nach dem
Content
-Anker sucht. Die möglichen Werte sind folgende Komponenten:
  • NewlineSearch. Der Beginn des
    Content
    -Ankers ist das nächste Newline-Zeichen.
  • OffsetSearch. Der Beginn des
    Content
    -Ankers ist die Anzahl der Zeichen, die in
    offset
    angegeben sind.
  • PatternSearch. Der Beginn des
    Content
    -Ankers ruft den ersten Text ab, der mit einem angegebenen regulären Ausdruck übereinstimmt.
  • TextSearch. Der Beginn des
    Content
    -Ankers ist ein festgelegter Textstring.
optional
Legt fest, ob ein Komponentenfehler den Ausfall der übergeordneten Komponente verursacht. Sie können eine der folgenden Optionen auswählen:
  • Ausgewählt. Ein Komponentenfehler führt nicht zum Ausfall der übergeordneten Komponente.
  • Gelöscht. Ein Komponentenfehler verursacht den Ausfall der übergeordneten Komponente.
Standardwert ist "Gelöscht". Weitere Informationen über Komponentenfehler finden Sie in Fehlerbehandlung.
phase
Legt den Zeitpunkt fest, an dem das Skript die Komponente verarbeitet. Sie können eine der folgenden Optionen auswählen:
  • Anfangsphase. Das Skript verarbeitet die Komponente während der Anfangsphase.
  • Hauptphase. Das Skript verarbeitet die Komponente während der Hauptphase.
  • Endphase. Das Skript verarbeitet die Komponente während der Endphase.
Weitere Informationen hierzu finden Sie unter So sucht der Parser Anker.
Standardwert ist "Hauptphase".
remark
Ein benutzerdefinierter Kommentar, der den Zweck oder die Aktion der Komponente beschreibt.
Transformer
Definiert eine Sequenz von Transformern, die der Parser auf den abgerufenen Text anwendet. Weitere Informationen unterTransformer.
validators
Definiert eine Liste von Validatoren, die auf die Daten angewendet werden. Weitere Informationen hierzu finden Sie unter Validatoren.
value
Definiert Kriterien für eine Suche in dem Bereich, die von den Attributen
opening_marker
und
closing_marker
definiert werden. Wenn kein
opening_marker
definiert ist, wird zwischen den umgebenden Referenzpunkten gesucht. Weitere Informationen hierzu finden Sie unter So sucht der Parser Anker. Sie können eine der folgenden Optionen auswählen:
  • Leer. Der
    Content
    -Anker ruft den gesamten Suchbereich ab.
  • AttributeSearch. Der
    Content
    -Anker ruft den Wert aus einem Ausdruck des Typs
    AttributeName = ...
    ab. Verwenden Sie diese Option, um Attributwerte aus einem XML- oder HTML-Quelldokument abzurufen.
  • LearnByExample. Der Parser lernt anhand des Parserformats und der Beispielquelle, welchen Text er abrufen soll. Wenn der Parser zum Beispiel ein tabulatorbegrenztes Format hat, zählt er die Anzahl der Tabulatoren vom Anfang des Suchbereichs ab bis zum Beispieltext. Er ruft den Text zwischen den entsprechenden Tabulatoren im Quelldokument ab.
  • PatternSearch. Der
    Content
    -Anker ruft den ersten Text ab, der mit einem angegebenen regulären Ausdruck übereinstimmt.
  • TypeSearch. Der
    Content
    -Anker ruft den ersten Text ab, der mit einem angegebenen Datentyp übereinstimmt.
Standardwert ist "Leer". Weitere Informationen zu diesen Optionen finden Sie im Abschnitt Suchkomponenten: Referenz. Neben den Suchkomponenten verwendet der Parser den Datentyp von
data_holder
als Suchkriterium. Weitere Informationen hierzu finden Sie unter Eingrenzen der Suchkriterien mit Datentypen.
Die Eigenschaften
opening_marker
und
closing_marker
sind den
Marker
-Ankern in einer
Group
-Komponente gleichgestellt.
  • Ein
    Content
    -Anker mit eingestelltem
    opening_marker
    ist wie eine
    Group
    -Komponente mit der folgenden Ankersequenz:
    1. Marker
    2. Content
  • Ein
    Content
    -Anker mit eingestelltem
    closing_marker
    ist wie eine
    Group
    -Komponente mit der folgenden Ankersequenz:
    1. Content
    2. Marker
  • Ein
    Content
    -Anker mit eingestelltem
    opening_marker
    und
    closing_marker
    ist wie eine
    Group
    -Komponente mit der folgenden Ankersequenz:
    1. Marker
    2. Content
    3. Marker
Weitere Informationen hierzu finden Sie im Abschnitt Suchkomponenten: Referenz.