入力

このステージは、構造化されていない文字列データを入力として受け取ります。また、構造化されていないドキュメントからテキストを分類する場合は、Read from Documents ステージを入力として使用できます。Read from Documents ステージは、ドキュメントを読み取り、ユーザ定義の設定に基づいてテキストを返します。これが Text Categorizer ステージに読み込まれ、必要な出力が提供されます。

表 1. 入力フォーマット

フィールド名

説明

PlainText

情報の抽出元となるデータを表す構造化されていない文字列です。