Write to Hadoop Sequence File

La etapa Write to Hadoop Sequence File escribe datos en un archivo de secuencia como una salida desde un flujo de datos. Un archivo de secuencia es un archivo simple que consta de pares de clave/valor binarios. Para obtener más información, visite http://wiki.apache.org/hadoop/SequenceFile.

Nota: La etapa Write to Hadoop Sequence File solo admite archivos delimitados sin comprimir, ubicados en el Sistema de archivos distribuido Hadoop (Hadoop Distributed File System, HDFS).

Ficha Propiedades del archivo

Campos Descripción
Servidor Indica que el archivo que seleccionó en el campo Nombre de archivo está ubicado en el sistema Hadoop. Debe crear una conexión al servidor de archivos Hadoop en Management Console, antes de usarlo en esta etapa. Si selecciona un archivo en el sistema Hadoop, el nombre del servidor será el nombre que especifique en la Management Console mientras se crea un servidor de archivos.
Nombre de archivo Especifica la ruta al archivo. Haga clic en el botón de los puntos suspensivos (...) para buscar el archivo que desea.

Separador de campo

Especifica el carácter que se utiliza para separar los campos en un archivo delimitado.

Por ejemplo, este registro utiliza una barra vertical (|) como separador de campo:

7200 13TH ST|MIAMI|FL|33144

Estos caracteres disponibles para definir como separadores de campo son:

  • Espacio de claves
  • Tab
  • Coma
  • Punto
  • Punto y coma
  • Barra vertical

Si el archivo utiliza un carácter distinto como separador de campo, haga clic en el botón de los puntos suspensivos para seleccionar otro carácter como delimitador.

Text qualifier (Calificador de texto)

El carácter que se utiliza para demarcar los valores de texto en un archivo delimitado.

Por ejemplo, este registro utiliza comillas dobles (") como calificador de texto.

"7200 13TH ST"|"MIAMI"|"FL"|"33144"

Los caracteres disponibles para definir como calificadores de texto son:

  • Comilla simple (')
  • Comilla doble (")

Si el archivo utiliza un calificador de texto distinto, haga clic en el botón de los puntos suspensivos para seleccionar otro carácter como calificador de texto.

Ficha Campos

La ficha Campos define los nombres, las posiciones y los tipos de campos en el archivo. Para obtener más información, consulte Definición de campos en un archivo de secuencia de salida