Extraction d'entités pré-existantes

  1. Créez un flux de données incluant un stage source Read from Documents, un stage Entity Extractor et un stage de collecteur de données tel que Write to File ou Write to XML.
  2. Dans le stage source, pointe vers votre fichier d'entrée.
  3. Dans le stage Entity Extractor, sélectionnez les entités en fonction des données que vous souhaitez extraire du fichier d’entrée. Par exemple, si vous souhaitez sélectionner les noms de toutes les personnes et les adresses du fichier, sélectionnez les entités Address et Person.
    Remarque : Address et Person sont les entités par défaut. Pour extraire les données en fonction d’une autre entité, cochez la case Neutralisation des options système par défaut avec les valeurs suivantes, puis cliquez sur Ajout rapide. La liste des entités s'affiche dans la section Sélectionner des entités.
  4. Pour obtenir la fréquence dans le fichier d’entrée des données associées aux entités spécifiées, cochez la case Nombre d’entités de sortie.
  5. Cliquez sur OK.
  6. Exécutez le job.