目次

Search

  1. はじめに
  2. データトランスフォーメーションについて
  3. データプロセッサトランスフォーメーション
  4. ウィザードの入力形式および出力形式
  5. リレーショナル入力とリレーショナル出力
  6. IntelliScriptエディタの使用
  7. XMap
  8. ライブラリ
  9. スキーマオブジェクト
  10. コマンドラインインタフェース
  11. スクリプト
  12. パーサー
  13. スクリプトポート
  14. ドキュメントプロセッサ
  15. 形式
  16. データホルダ
  17. アンカー
  18. トランスフォーマ
  19. アクション
  20. シリアライザ
  21. マッパー
  22. ロケータ、キー、インデックス
  23. ストリーマ
  24. バリデータ、通知、およびエラーの取扱い
  25. 検証ルール
  26. カスタムスクリプトコンポーネント

ユーザーガイド

ユーザーガイド

区切り文字コンポーネントのリファレンス

区切り文字コンポーネントのリファレンス

区切り文字コンポーネントでは、新しい行、スペース、タブ、カンマ、縦棒などドキュメントの情報を整理する文字または文字列の階層が定義されます。ワイルドカードパターンを使用して区切り文字を定義することもできます。
区切り文字の概念は、データフィールドを区別するために事前に定義された区切り文字を使用する厳密に構造化されたドキュメントにも、新しい行や構文マークアップによって区切られる、構造化が厳しくないテキストまたはHTMLドキュメントにも適用することができます。区切り文字の概念は、フィールドが相互に固定されたオフセットに存在する位置的に構造化されたデータにも及びます。
パーサーは、区切り文字を使用して、
LearnByExample
オプションで設定された
Content
アンカーの検索条件を決定します。
例えば、
TabDelimited
区切り文字コンポーネントを使用して形式を構成したとします。このコンポーネントを使用すると、次の文字を区切り文字として階層が定義されます。
Newline Tab
次のようにサンプルソースで
Marker
アンカーの後に続く2つのタブ文字で
Content
アンカーを定義することができます。
MARKER<tab>abc<tab>CONTENT
パーサーがソースドキュメントを処理する際に、
Marker
の後の
Content
の2つのタブが検索されます。
2番目のサンプルでは、
Marker
アンカーの後に続く3つの新しい行と1つのタブで
Content
アンカーを定義します。
MARKER abc<tab>de fghi<tab>jkl<tab>mnop pqrst<tab>CONTENT
中間の行のタブは、新しい行の方が階層で高い位置にあるため、カウントされません。
TabDelimited
CommaDelimited
など、多くの区切り文字コンポーネントには事前定義の区切り文字階層が表示されますが、これは必要に応じて編集することができます。
DelimiterHierarchy
コンポーネントには事前定義階層がありません。何でも必要な区切り文字を挿入することができます。