目次

Search

  1. はじめに
  2. データトランスフォーメーションについて
  3. データプロセッサトランスフォーメーション
  4. ウィザードの入力形式および出力形式
  5. リレーショナル入力とリレーショナル出力
  6. IntelliScriptエディタの使用
  7. XMap
  8. ライブラリ
  9. スキーマオブジェクト
  10. コマンドラインインタフェース
  11. スクリプト
  12. パーサー
  13. スクリプトポート
  14. ドキュメントプロセッサ
  15. 形式
  16. データホルダ
  17. アンカー
  18. トランスフォーマ
  19. アクション
  20. シリアライザ
  21. マッパー
  22. ロケータ、キー、インデックス
  23. ストリーマ
  24. バリデータ、通知、およびエラーの取扱い
  25. 検証ルール
  26. カスタムスクリプトコンポーネント

ユーザーガイド

ユーザーガイド

PdfToTxt_4テーブル設定エディタ

PdfToTxt_4テーブル設定エディタ

このテーブル設定エディタは、
PdfToTxt_4
ドキュメントプロセッサがPDFドキュメント内のテーブルを変換する方法をカスタマイズします。
テーブル設定エディタは、
PdfToTxt_4
ドキュメントプロセッサのデフォルトの設定が、列の並び、ワードラッピング、行間隔、またはセルから別のセルへのオーバーフローを正しく表示しない場合に使用します。
テーブル設定エディタのユーザーインタフェースは英語でのみ表示されます。
  1. スクリプトにパーサー、マッパー、シリアライザ、または
    AdditionalInputPort
    を追加します。
  2. example_source
    プロパティの下で、
    pre_processor
    プロパティをPdfToTxt_4に設定します。
  3. pre_processor
    プロパティの下で、
    value
    プロパティをダブルクリックします。
    テーブル設定エディタが表示されます。上部パネルに入力PDFドキュメントが表示され、下部パネルに
    PdfToTxt_4
    出力が表示されます。
    テーブルの編集コマンドは、ウィンドウ上部のツールバーに表示されます。右クリックすると編集メニューが表示されます。
  4. PDFドキュメント内のテーブルで、
    [テーブルの追加]
    をクリックします。
    テーブルの名前が
    [テーブル]
    フィールドと
    [名前]
    フィールドに表示されます。
  5. [正規表現を使用する]
    を選択します。
    [テーブル開始]
    フィールドに、テーブルの左上隅を定義する正規表現を入力します。
    最初の2列のヘッダを正規表現として使用します。
    [テーブル開始]
    には、必要に応じてさらに列ヘッダを追加することもできます。列間の幅を広くとる場合でも、ヘッダは半角スペース文字で分割します。
  6. [テーブル終了]
    フィールドに、テーブルの直後のテキストを定義する正規表現を入力します。
    [テーブル終了]
    の値は、ページのフッタではなく、ドキュメントの本文に表示される必要があります。
  7. [処理]
    をクリックします。
    PdfToTxt_4
    が検出したテーブル設定がエディタに表示されます。テーブルの上端と下端は青い横線で表示されます。列の既定の境界は赤い縦線で表示されます。
  8. 列の境界を編集するには、次の手順を1つ以上行います。
    • 列の境界の位置を変更するには、境界を右または左にドラッグします。
    • 列を追加するには、
      [列の追加]
      をクリックします。
    • 列を削除するには、
      [列の削除]
      をクリックして列の境界を選択します。
    横方向に結合されたセルがテーブルにある場合は、
    PdfToTxt_4
    でエントリが切り捨てられる場合があります。
  9. テーブルが正しく変換されたかどうかは、出力ウィンドウで確認できます。正しく変換されていない場合は、テーブル定義を修正します。
  10. PDFドキュメント内の各テーブルについて、手順1~9を繰り返します。
  11. [OK]
    をクリックしてDeveloperツールに戻ります。
    テーブル設定を定義するXML文字列が
    PdfToTxt_4
    ドキュメントプロセッサの
    value
    プロパティに表示されます。