Extracción de entidades preexistentes
- Cree un flujo de datos que incluya una etapa de origen Read from Documents, una etapa Entity Extractor y una etapa receptora como Write to File o Write to XML.
- Durante la etapa de origen, indique el archivo de entrada.
-
En la etapa Entity Extractor, seleccione las entidades según los datos que desea extraer del archivo de entrada. Por ejemplo, si desea seleccionar los nombres de todas las personas y direcciones del archivo, seleccione las entidades Address (Dirección) y Person (Persona).
Nota: Address y Person son las entidades predeterminadas. Para extraer datos según cualquier otra entidad, seleccione la casilla de verificación Anular opciones predeterminadas del sistema con los siguientes valores y haga clic en Agregado rápido. La lista de las entidades se muestra en la sección Seleccionar entidades.
- Para obtener la frecuencia en el archivo de entrada de los datos relacionados con las entidades especificadas, seleccione la casilla de verificación Conteo de entidades de salida.
- Haga clic en Aceptar.
- Ejecute el trabajo.