Composants du module Information Extraction

Le module Information Extraction inclut ces stages.

  • Read From Documents : lit les données d'entrée non structurées de différents formats de fichier et en extrait le contenu.
  • Entity Extractor : extrait les entités telles que les noms et les adresses de données non structurées transmises sous forme de chaînes.
  • Text Categorizer : affecte des catégories personnalisées à un contenu non structuré ou à un texte en clair (tel que des courriers électroniques, des articles d'actualité et des commentaires) en fonction de la quantité de contenu correspondant à ladite catégorie.
  • Relationship Extractor : extrait les relations entre les entités.