Information Extraction モジュール

関連性抽出

Information Extraction モジュールで、自然言語による入力テキストをパーシングし、そのテキスト内で検出されたエンティティのペアの間に存在する関連性タイプを識別できるようになりました。この操作は、新しくなった Relationship Extractor ステージで行うことができます。

Relationship Extractor では、以下のエンティティ タイプの間の関連性を識別できます。

  • Person
  • 組織
  • 場所

モデルを評価およびトレーニングするためのコマンド

Information Extraction モジュールに、新しいモデルと既存モデルを評価およびトレーニングするための管理ユーティリティ コマンドが追加されました。そのコマンドはiemodel trainAndevaluate modelです。これは、既存のモデルのみを評価する iemodel evaluate train_modelコマンドに置き換わるものです。

エンティティ抽出とテキスト分類のステージの分離

Information Extraction モジュールで、テキスト分類とエンティティ抽出に個別のステージが用意されるようになりました。これまでは、両方の機能が Information Extractor ステージで実行されていました。現在は、Entity ExtractorText Categorizer という 2 つのステージがあります。Entity Extractor は、構造化されていないデータの文字列から名前や住所などのエンティティを抽出する場合に使用します。Text Categorizer は、構造化されていないコンテンツまたはプレーン テキストにカスタム カテゴリを割り当てる場合に使用します。