Composants du module Information Extraction

Le module Information Extraction inclut ces stages.

Read From Documents : lit les données d'entrée non structurées de différents formats de fichier et en extrait le contenu.
Entity Extractor : extrait les entités telles que les noms et les adresses de données non structurées transmises sous forme de chaînes.
Text Categorizer : affecte des catégories personnalisées à un contenu non structuré ou à un texte en clair (tel que des courriers électroniques, des articles d'actualité et des commentaires) en fonction de la quantité de contenu correspondant à ladite catégorie.
Relationship Extractor : extrait les relations entre les entités.