Composants du module Information Extraction
Le module Information Extraction inclut ces stages.
- Read From Documents : lit les données d'entrée non structurées de différents formats de fichier et en extrait le contenu.
- Entity Extractor : extrait les entités telles que les noms et les adresses de données non structurées transmises sous forme de chaînes.
- Text Categorizer : affecte des catégories personnalisées à un contenu non structuré ou à un texte en clair (tel que des courriers électroniques, des articles d'actualité et des commentaires) en fonction de la quantité de contenu correspondant à ladite catégorie.
- Relationship Extractor : extrait les relations entre les entités.