InformationExtractor

InformationExtractor extrahiert Entitäten wie Namen und Adressen aus Zeichenfolgen mit unstrukturierten Daten (auch Klartext oder Nur-Text).

Möglicherweise werden nicht alle Entitäten eines ausgewählten Typs zurückgegeben, da die Genauigkeit je nach Eingabetyp variiert. Da Information Extractor natürlichsprachige Verarbeitung verwendet, werden bei einer Zeichenfolge mit einem grammatikalisch korrekten Satz aus einem Nachrichtenartikel oder einem Blog wahrscheinlich mehr Namen korrekt zurückgegeben, als wenn nur eine einfach Liste mit Namen und Daten vorliegt.

Ressourcen-URL

JSON-Endpunkt:

http://server:port/rest/InformationExtractor/result.json

XML-Endpunkt:

http://server:port/rest/InformationExtractor/result.xml

Beispiel mit JSON-Antwort

Im folgenden Beispiel wird eine JSON-Antwort angefordert:

http://myserver:8080/rest/InformationExtractor/result.json?​Data.PlainText=My+name+is+Arthur+Pitney&​Option.EntityList=Person

Die von dieser Anforderung zurückgegebene JSON-Antwort würde wie folgt lauten:

{"output_port": [{
   "Entity": [   {
   "Text": "Aurthur Pitney",
   "Type": "Person"
   }],
   "user_fields": []
}]}

Beispiel mit XML-Antwort

Im folgenden Beispiel wird eine XML-Antwort angefordert:

http://myserver:8080/rest/InformationExtractor/result.xml?​Data.PlainText=My+name+is+Arthur+Pitney&​Option.EntityList=Person

Die von dieser Anforderung zurückgegebene XML-Antwort würde wie folgt lauten:

<xml.InformationExtractorResponse xmlns="http://www.pb.com/spectrum/services/InformationExtractor">
   <output_port>
      <Result>
         <Entity>
            <Entity>
               <Text>Aurthur Pitney</Text>
               <Type>Person</Type>
            </Entity>
         </Entity>
         <user_fields/>
      </Result>
   </output_port>
</xml.InformationExtractorResponse>