Extracción de entidades preexistentes

  1. Cree un flujo de datos que incluya una etapa de origen Read from Documents, una etapa Entity Extractor y una etapa receptora como Write to File o Write to XML.
  2. Durante la etapa de origen, indique el archivo de entrada.
  3. En la etapa Entity Extractor, seleccione las entidades según los datos que desea extraer del archivo de entrada. Por ejemplo, si desea seleccionar los nombres de todas las personas y direcciones del archivo, seleccione las entidades Address (Dirección) y Person (Persona).
    Nota: Address y Person son las entidades predeterminadas. Para extraer datos según cualquier otra entidad, seleccione la casilla de verificación Anular opciones predeterminadas del sistema con los siguientes valores y haga clic en Agregado rápido. La lista de las entidades se muestra en la sección Seleccionar entidades.
  4. Para obtener la frecuencia en el archivo de entrada de los datos relacionados con las entidades especificadas, seleccione la casilla de verificación Conteo de entidades de salida.
  5. Haga clic en Aceptar.
  6. Ejecute el trabajo.