Information Extraction コンポーネント

Information Extraction モジュールには、次のステージが含まれています。

Read From Documents — さまざまなファイル形式から構造化されていない入力データを読み取り、その内容を抽出します。
Entity Extractor — 文字列として渡された構造化されていないデータから、名前や住所などのエンティティを抽出します。
Text Categorizer — 構造化されていないコンテンツまたはプレーンテキスト (電子メール、ニュース記事、コメントなど) にカスタムカテゴリを割り当てます。そのカテゴリに関連する内容がどれだけ含まれているかに基づいて分類します。
Relationship Extractor — エンティティ間の関連性を抽出します。