Write to Hadoop Sequence File
La etapa Write to Hadoop Sequence File escribe datos en un archivo de secuencia como una salida desde un flujo de datos. Un archivo de secuencia es un archivo simple que consta de pares de clave/valor binarios. Para obtener más información, visite http://wiki.apache.org/hadoop/SequenceFile.
Ficha Propiedades del archivo
Campos | Descripción |
---|---|
Servidor | Indica que el archivo que seleccionó en el campo Nombre de archivo está ubicado en el sistema Hadoop. Debe crear una conexión al servidor de archivos Hadoop en Management Console, antes de usarlo en esta etapa. Si selecciona un archivo en el sistema Hadoop, el nombre del servidor será el nombre que especifique en la Management Console mientras se crea un servidor de archivos. |
Nombre de archivo | Especifica la ruta al archivo. Haga clic en el botón de los puntos suspensivos (...) para buscar el archivo que desea. |
Separador de campo |
Especifica el carácter que se utiliza para separar los campos en un archivo delimitado. Por ejemplo, este registro utiliza una barra vertical (|) como separador de campo:
Estos caracteres disponibles para definir como separadores de campo son:
Si el archivo utiliza un carácter distinto como separador de campo, haga clic en el botón de los puntos suspensivos para seleccionar otro carácter como delimitador. |
Text qualifier (Calificador de texto) |
El carácter que se utiliza para demarcar los valores de texto en un archivo delimitado. Por ejemplo, este registro utiliza comillas dobles (") como calificador de texto.
Los caracteres disponibles para definir como calificadores de texto son:
Si el archivo utiliza un calificador de texto distinto, haga clic en el botón de los puntos suspensivos para seleccionar otro carácter como calificador de texto. |
Ficha Campos
La ficha Campos define los nombres, las posiciones y los tipos de campos en el archivo. Para obtener más información, consulte Definición de campos en un archivo de secuencia de salida