オプション

[ファイル プロパティ] タブ

以下の表に、ReadfromDocuments が返す情報の種類を制御するオプションの一覧を示します。

表 1. ReadfromDocuments のオプション

オプション

説明

サーバ名

使用する Spectrum Technology Platform サーバの名前を指定します。

ファイル/フォルダ名

ソース ドキュメントまたはフォルダのパスおよび名前です。フォルダを指す場合には、アスタリスクを ("*") ワイルドカード文字として使用して、フォルダ内のすべてのファイルを選択します。同一フォルダ内にある同じタイプの複数のファイルを指す場合は、ワイルドカード文字にファイル拡張子 ("*.pdf") を付け加えて使用します。

ファイル タイプ:

ソース ドキュメントのファイル タイプです。ソースを選択すると、自動的に選択されます。
  • テキスト
  • PDF
  • Microsoft Outlook
  • Microsoft Word
  • HTML

抽出タイプ

ドキュメント
ドキュメント全体を使用します。
ページ
ドキュメントの特定のページを使用します。
選択
ドキュメントの選択部分を使用します。
ブックマーク
PDF ドキュメントからのブックマークを使用します。

ページの選択

「ページ」抽出タイプでのみ使用します。すべてのページまたはページ範囲を選択します。

選択された抽出

「選択」抽出タイプでのみ使用します。検索のタイプを指定します。

テキスト詳細

「選択」抽出タイプでのみ使用します。探し出すテキストを指定します。

開始テキストを除外する

「選択」抽出タイプと「開始テキスト」オプションの組み合わせでのみ使用します。入力された文字列を返されるデータから除外します。

終了テキストを指定する

「選択」抽出タイプでのみ使用します。探し出す終了テキストを指定します。

終了テキストを除外する

「選択」抽出タイプでのみ使用します。入力された文字列を返されるデータの末尾から除外します。

選択リターン

「選択」抽出タイプでのみ使用します。それぞれの結果で返す段落数を指定します。例えば、ここで "2" を選択した場合、それぞれの結果で返されるデータには、その結果の段落に後続の段落を加えた合計 2 つの段落が含まれることになります。デフォルトは 1 です。終了テキストが指定されると無効になります。

[フィールド] タブ

入力フィールドの定義を行うには、[再生成] をクリックします。
表 2. 出力データ オプション

オプション

説明

属性名

入力フィールドに最も近い属性を示します。例えば、フィールドに日付情報が含まれていて、その情報を "Date" (日付) と呼んでいる場合は、そのフィールドに "Date" (日付) 属性が割り当てられます。この列は編集できません。

名前

フィールドの名前です。この列は編集できます。

タイプ

フィールドのデータ タイプ。

含める

どのフィールドを検索インデックスに含めるかを指定します。