Input

Los datos de entrada de Read from Documents son un archivo o una carpeta. Esta etapa admite los siguientes tipos de archivo:
  • Texto
  • PDF
  • Microsoft Outlook
  • Microsoft Word
  • HTML
Read from Documents realiza tres tipos de extracciones:
  • Documento: use el documento completo
  • Página: use una página específica de un documento
  • Selectiva: use una parte seleccionada de un documento
  • Marcadores: use los marcadores de un documento PDF
Read from Documents forma parte del módulo Information Extraction.