Inhaltsverzeichnis

Search

  1. Vorwort
  2. Einführung in die Datenumwandlung
  3. Datenprozessor-Umwandlung
  4. Assistent für Eingabe- und Ausgabeformate
  5. Relationale Eingabe und Ausgabe
  6. Verwenden des IntelliScript-Editors
  7. XMap
  8. Bibliotheken
  9. Schema-Objekt
  10. Eingabeaufforderung
  11. Skripte
  12. Parser
  13. Skriptports
  14. Dokumentprozessoren
  15. Formate
  16. Datenbehälter
  17. Anker
  18. Transformer
  19. Aktionen
  20. Serializer
  21. Mapper
  22. Lokatoren, Schlüssel und Indexierung
  23. Streamer
  24. Validatoren, Benachrichtigungen und Fehlerbehandlung
  25. Validierungsregeln
  26. Benutzerdefinierte Skriptkomponenten

Benutzerhandbuch

Benutzerhandbuch

TextFormat

TextFormat

Das Format
TextFormat
definiert das Format der Textdateien.
Verwenden Sie dieses Format in Kombination mit einem Dokumentprozessor, um andere Dokumenttypen zu verarbeiten. Beispielsweise können Sie mit dem Dokumentprozessor
PdfToTxt_4
PDF-Dokumente verarbeiten.
In der folgenden Tabelle werden die Eigenschaften des Formats
TextFormat
beschrieben:
Eigenschaft
Beschreibung
default_transformers
Definiert eine Liste von Transformern, die der Parser auf die Ausgabe der einzelnen Content-Anker anwendet.
Standardwert ist die folgende Liste von Transformern:
  • HtmlProcessor. Wandelt alle Kombinationen aus Tabulatorzeichen, Leerzeichen oder Zeilenwechselzeichen in ein einzelnes Leerzeichen um.
  • RemoveMarginSpace. Entfernt vorangestellte und angehängte Leerzeichen.
delimiters
Definiert die Informationsstruktur im Dokument. Sie können eine der folgenden Optionen auswählen:
  • CommaDelimited. Datenfelder sind durch Kommas getrennt.
  • DelimiterHierarchy. Datenfelder sind getrennt oder umgeben von Textzeichen.
  • HL7. Datenfelder werden gemäß HL7-Standard voneinander getrennt.
  • Positionsbasiert. Datenfelder werden durch die Anzahl der Zeichen zwischen ihnen definiert.
  • PostScript. Datenfelder werden gemäß dem PostScript-Format definiert.
  • RTF. Datenfelder werden gemäß dem RTF-Format definiert.
  • SGML. Datenfelder werden gemäß dem SGML-Format definiert.
  • SpaceDelimited. Datenfelder sind durch Leerstellen getrennt.
  • TabDelimited. Datenfelder sind durch Tabulatorzeichen getrennt.
Weitere Informationen hierzu finden Sie unter Delimiter-Komponenten: Referenz.
Standardwert ist DelimiterHierarchy.
name
Eine beschreibende Kennzeichnung für die Komponente. Diese Kennzeichnung wird in der Protokolldatei sowie der
Ereignisansicht
angezeigt. Ermitteln Sie anhand der Eigenschaft
name
, welche Komponente das Ereignis verursacht hat.
pre_processor
Definiert einen Format-Präprozessor, der die Eingabe nach einem beliebigen von Ihnen für die
pre_processor
-Eigenschaft der
example_source
definierten Dokumentprozessor verarbeitet. Sie können eine der folgenden Optionen auswählen:
  • HtmlProcessor. Wandelt alle Kombinationen aus Tabulatorzeichen, Leerzeichen oder Zeilenwechselzeichen in ein einzelnes Leerzeichen um. Er ist nicht auf HTML-Dokumente beschränkt.
  • RtfProcessor. Normalisiert RTF-Dateien.
Standardwert ist "Leer".
remark
Ein benutzerdefinierter Kommentar, der den Zweck oder die Aktion der Komponente beschreibt.