Module Information Extraction

Le module Information Extraction fournit des fonctionnalités avancées de traitement de texte et d'extraction des informations du texte d'entrée en langage naturel.

Il comprend des modèles préformés qui sont utilisés pour extraire des entités d’un texte d’entrée, déterminer la relation entre les entités et affecter la catégorie à laquelle le texte appartient.

Fonctions fournies

Extraction d'entités: Extrait les entités de données non structurées et les classe en types, tels que Location, Date, Organization, ProperNouns, Address et Person. Le module est livré avec certaines entités préexistantes. Cependant, il a également la capacité de former des modèles en fonction de vos besoins. Pour plus de détails sur la formation d'un modèle et la définition d'entités personnalisées, reportez-vous à la section Entités personnalisées.
Extraction de relations: Identifie le type de relation liant les entités dans tout texte d'entrée en langage naturel.
Text Categorization: Attribue des catégories, telles que e-mails, rapports médicaux et sports, à votre texte non structuré en fonction de son contenu. Avant de catégoriser, vous devez former un modèle de catégorisation de texte à l'aide de l'utilitaire Administration. Cette fonction peut servir à indexer des rapports de soins de santé de patients, à classer des documents par domaines et sous-domaines et à catégoriser des courriers électroniques en SPAM et non SPAM, entre autres applications. Elle classe également les catégories identifiées en fonction de la mesure dans laquelle votre texte correspond à celles-ci.