既存エンティティの抽出
- Read from Documents ソース ステージ、Entity Extractor ステージ、およびシンク ステージ (Write to File や Write to XML など) を含む、データフローを作成します。
- ソース ステージで、入力ファイルを指定します。
-
Entity Extractor ステージで、入力文字列から抽出するデータに基づいてエンティティを選択します。例えば、ファイルに含まれているすべての人名と住所を選択するなら、Address と Person エンティティを選択します。
注: Address と Person はデフォルトのエンティティです。他のエンティティに基づいてデータを抽出するには、[次の値でシステム デフォルト オプションを上書きします] チェック ボックスを選択し、[クイック追加] をクリックします。エンティティのリストが [エンティティの選択] セクションに表示されます。
- 指定したエンティティに関連するデータの入力ファイル内での出現回数を取得するには、[出力エンティティ数] チェック ボックスを選択します。
- [OK] をクリックします。
- ジョブを実行します。