Extrahieren vorher vorhandener Entitäten

  1. Erstellen Sie einen Datenfluss, der einen Read from Documents-Quellschritt, einen Entity Extractor-Schritt und einen Zielschritt wie Write to File oder Write to XML umfasst.
  2. Verweisen Sie im Quellschritt auf Ihre Eingabedatei.
  3. Wählen Sie im Entity Extractor-Schritt die Entitäten basierend auf den Daten, die Sie aus der Eingabedatei extrahieren möchten, aus. Wenn Sie beispielsweise die Namen aller Personen und alle Adressen in der Datei auswählen möchten, wählen Sie die Entitäten Address und Person aus.
    Anmerkung: Bei Address und Person handelt es sich um die Standardentitäten. Um die Daten basierend auf einer anderen Entität zu extrahieren, aktivieren Sie das Kästchen System-Standardoptionen mit den folgenden Werten überschreiben und klicken Sie auf Schnell hinzufügen. Die Liste mit den Entitäten wird im Bereich Entität auswählen angezeigt.
  4. Aktivieren Sie das Kontrollkästchen Anzahl der Ausgabeentitäten, um die Häufigkeit der Daten in der Eingabedatei bezüglich der angegebenen Entitäten abzurufen.
  5. Klicken Sie auf OK.
  6. Führen Sie den Auftrag aus.