Catégorisation de texte

  1. Créez un flux de données incluant un stage source tel que Read from File ou Read from XML, le stage Text Categorizer et un stage de collecteur de données tel que Write to File ou Write to XML.
  2. Dans le stage source, pointe vers votre fichier d'entrée.
  3. Dans le stage Text Categorizer, sélectionnez le modèle dans le champ Nom de l'élément de catégorisation. Il s’agit du modèle que vous avez formé dans la phase de catégorisation de texte. Pour plus d'informations sur la formation d'un modèle, reportez-vous à la section Formation du modèle.
  4. Dans le champ Nombre de catégories, sélectionnez le nombre de niveaux de correspondance de catégorie à inclure dans la sortie. Par exemple, la correspondance la plus proche ou la correspondance la plus proche plus la deuxième correspondance proche.
    Remarque : La valeur maximale correspond au nombre de catégories différentes indiqué lors de la formation du modèle.
  5. Cliquez sur OK.
  6. Exécutez le job.