Read From Hive File

La etapa Read from Hive File lee datos del archivo seleccionado, que puede estar en cualquiera de los siguientes formatos:
  • ORC
  • RC
  • Parquet
  • Avro

Ficha Propiedades del archivo

Campos Descripción
Servidor Indica que el archivo que seleccionó en el campo Nombre de archivo está ubicado en el sistema Hadoop. Debe crear una conexión al servidor de archivos Hadoop en Management Console, antes de usarlo en esta etapa. Si selecciona un archivo en el sistema Hadoop, el nombre del servidor será el nombre que especifique en la Management Console mientras se crea un servidor de archivos.
Nombre de archivo Especifica la ruta al archivo. Haga clic en el botón de los puntos suspensivos (...) para buscar el archivo que desea.
Nota: El esquema de un archivo de entrada se importa tan pronto navega hasta la ubicación correcta y selecciona el archivo. Este esquema importado no puede editarse.

Sin embargo, puede cambiar el nombre de las columnas del esquema según sea necesario.

Se recopilan los primeros 50 registros del archivo en la cuadrícula Vista previa al seleccionar el archivo.
Tipo de archivo Seleccione el tipo de archivo que se lee:
  • ORC
  • RC
  • Parquet
  • Avro
Nota: En el caso de los archivos RC, para generar la Vista previa, defina el esquema en la ficha Campos y luego haga clic en Vista previa en la ficha Propiedades del archivo.

Ficha Campos

La ficha Campos define los nombres, tipos de datos y posiciones de los campos como se encuentran en el archivo de entrada, así como también los nombres asignados por el usuario a los campos. Para obtener más información, consulteDefinición de campos para la lectura de Hive File.