既存エンティティの抽出

  1. Read from Documents ソース ステージ、Entity Extractor ステージ、およびシンク ステージ (Write to FileWrite to XML など) を含む、データフローを作成します。
  2. ソース ステージで、入力ファイルを指定します。
  3. Entity Extractor ステージで、入力文字列から抽出するデータに基づいてエンティティを選択します。例えば、ファイルに含まれているすべての人名と住所を選択するなら、AddressPerson エンティティを選択します。
    注: AddressPerson はデフォルトのエンティティです。他のエンティティに基づいてデータを抽出するには、[次の値でシステム デフォルト オプションを上書きします] チェック ボックスを選択し、[クイック追加] をクリックします。エンティティのリストが [エンティティの選択] セクションに表示されます。
  4. 指定したエンティティに関連するデータの入力ファイル内での出現回数を取得するには、[出力エンティティ数] チェック ボックスを選択します。
  5. [OK] をクリックします。
  6. ジョブを実行します。