Read From File

La etapa Read from File (Lectura desde archivo) especifica un archivo de entrada para un trabajo o subflujo. No está disponible para servicios.

Nota: Si desea utilizar un archivo XML como entrada de su flujo de datos, utiliza la etapa Read from XML en lugar de la etapa Read from File. Si desea utilizar un archivo de formato variable, use Read from Variable Format File.

Ficha Propiedades del archivo

Nombre de campo Descripción

Server name (Nombre de servidor)

Indica si el archivo que seleccionó como entrada está ubicado en la computadora que está ejecutando Enterprise Designer o en el servidor de Spectrum™ Technology Platform. Si selecciona un archivo en la computadora local, el nombre del servidor será Mi computadora. Si selecciona un archivo que se encuentra en el servidor, el nombre del servidor será Spectrum™ Technology Platform.

Nombre de archivo

Especifica la ruta al archivo. Haga clic en el botón de puntos suspensivos (...) para dirigirse al archivo que desea.

Puede leer múltiples archivos al usar el carácter comodín para leer datos desde múltiples archivos en el directorio. Los caracteres comodines * y ? son compatibles. Por ejemplo, puede especificar *.csv para leer todos los archivos con extensión .csv que se encuentran en el directorio. Para leer correctamente múltiples archivos, cada uno debe tener la misma disposición (los mismos campos en las mismas posiciones). Cualquier registro que no coincida con la disposición especificada en la ficha Campos se tratará como un registro malformado.

Cuando lee un archivo del servidor de archivos HDFS, los formatos de compresión compatibles son:
  1. GZIP (.gz)
  2. BZIP2 (.bz2)
Nota: La extensión del archivo indica el formato de compresión que se utiliza para descomprimir el archivo.
Atención: Si el servidor de Spectrum™ Technology Platform está ejecutándose en Unix o Linux, recuerde que estas plataformas distinguen las mayúsculas de las minúsculas en los nombres de los archivos y las rutas.

Tipo de registro

Formato de los registros en el archivo. Seleccione uno de:

En líneas secuenciales
Archivo de texto en el que los registros se separan con un carácter de final de línea (EOL), como un retorno de carro o un salto de línea (CR o LF) y cada campo tiene una posición fija para los caracteres de inicio y final.
De ancho fijo
Archivo de texto en el que cada registro es un número específico de caracteres de longitud y cada campo tiene una posición fija para los caracteres de inicio y final.
Delimitado
Archivo de texto en el que los registros se separan con un carácter de final de línea (EOL), como un retorno de carro o un salto de línea (CR o LF) y cada campo se separa con un carácter designado; por ejemplo, una coma.

Character encoding (Codificación de caracteres)

Codificación del archivo de texto. Seleccione uno de estos:

UTF-8
Admite todos los caracteres Unicode y es compatible con las versiones anteriores de ASCII. Para obtener más información sobre UTF, consulte unicode.org/faq/utf_bom.html.
UTF-16
Admite todos los caracteres Unicode, pero no es compatible con las versiones anteriores de ASCII. Para obtener más información sobre UTF, consulte unicode.org/faq/utf_bom.html.
US-ASCII
Codificación de caracteres basada en el orden del alfabeto inglés.
UTF-16BE
Codificación UTF-16 con serialización de bytes big endian (byte más significativo al principio).
UTF-16LE
Codificación UTF-16 con serialización de bytes little endian (byte menos significativo al principio).
ISO-8859-1
Codificación de caracteres ASCII, que suele utilizarse para los idiomas de Europa occidental. También se la conoce como Latin-1.
ISO-8859-3
Codificación de caracteres ASCII, que suele utilizarse para los idiomas de Europa meridional. También se la conoce como Latin-3.
ISO-8859-9
Codificación de caracteres ASCII, que suele utilizarse para el idioma turco. También se la conoce como Latin-5.
CP850
Página de códigos ASCII que se utiliza para escribir idiomas de Europa occidental.
CP500
Página de códigos EBCDIC que se utiliza para escribir idiomas de Europa occidental.
Shift_JIS
Codificación de caracteres para el idioma japonés.
MS932
Una extensión de Microsoft de Shift_JIS para incluir caracteres especiales NEC, selección NEC de extensiones IBM y extensiones IBM.
CP1047
Una página de códigos EBCDIC con el conjunto de caracteres completo del alfabeto latino 1.

Separador de campo

Especifica el carácter que se utiliza para separar los campos en un archivo delimitado.

Por ejemplo, este registro utiliza una barra vertical (|) como separador de campo:

7200 13TH ST|MIAMI|FL|33144

Estos caracteres disponibles para definir como separadores de campo son:

  • Espacio de claves
  • Tab
  • Coma
  • Punto
  • Punto y coma
  • Barra vertical

Si el archivo utiliza un carácter distinto como separador de campo, haga clic en el botón de los puntos suspensivos para seleccionar otro carácter como delimitador.

Text qualifier (Calificador de texto)

El carácter que se utiliza para demarcar los valores de texto en un archivo delimitado.

Por ejemplo, este registro utiliza comillas dobles (") como calificador de texto.

"7200 13TH ST"|"MIAMI"|"FL"|"33144"

Los caracteres disponibles para definir como calificadores de texto son:

  • Comilla simple (')
  • Comilla doble (")

Si el archivo utiliza un calificador de texto distinto, haga clic en el botón de los puntos suspensivos para seleccionar otro carácter como calificador de texto.

Record separator (Separador de registro)

Especifica el carácter que se utiliza para separar registros en archivos secuenciales o delimitados. Este campo no está disponible si selecciona la casilla Utilizar final de línea predeterminado .

Los parámetros de separador de registro disponibles son:

Unix (U+000A)
Un carácter de salto de línea separa los registros. Este es el separador de registros estándar para los sistemas Unix.
Macintosh (U+000D)
Un carácter de retorno de carro separa los registros. Este es el separador de registros estándar para los sistemas Macintosh.
Windows (U+000D U+000A)
Un carácter de retorno de carro seguido por un salto de línea separa los registros. Este el separador de registros estándar para los sistemas Windows.

Si su archivo utiliza un separador de registro distinto, haga clic en el botón de los puntos suspensivos para seleccionar otro carácter como separador de registro.

Use default EOL (Utilizar final de línea predeterminado)

Especifica que el separador de registro del archivo es el carácter de final de línea (EOL) predeterminado que utiliza el sistema operativo en el que se ejecuta el servidor Spectrum™ Technology Platform.

No seleccione esta opción si el archivo utiliza un carácter de final de línea distinto del que utiliza de forma predeterminada el sistema operativo del servidor. Por ejemplo, si el archivo utiliza un final de línea de Windows pero el servidor está ejecutándose en Linux, no seleccione esta opción. En su lugar, seleccione la opción Windows en el campo Separador de registro.

Record length (Longitud de registro)

Para los archivos de ancho fijo, especifica la cantidad exacta de caracteres en cada registro.

Para los archivos secuenciales, especifica la longitud, en caracteres, del registro más largo del archivo.

First row is header record (La primera fila es el registro de encabezado)

Especifica si el primer registro de un archivo delimitado contiene información del encabezado pero no datos.

Por ejemplo, este fragmento de archivo muestra una fila de encabezado en el primer registro.

"AddressLine1"|"City"|"StateProvince"|"PostalCode"
"7200 13TH ST"|"MIAMI"|"FL"|"33144"
"One Global View"|"Troy"|"NY"|12180

Considerar malformados los registros con menos campos que los especificados

Se considerarán malformados los registros de archivos delimitados que contengan menos campos que los especificados en la ficha Campos.

Importar

Importa la definición de diseño de un archivo, los ajustes de codificación y las opciones de ordenamiento desde un archivo de configuración. El archivo de configuración se crea al exportar la configuración de otra etapa Read from File o Write to File que utilizó el mismo archivo de entrada o un archivo con el mismo diseño que aquel en el que usted está trabajando.

Exportar

Guarda la definición de diseño de un archivo, los ajustes de codificación y las opciones de ordenamiento en un archivo de configuración. Luego, puede importar estas configuraciones a otra etapa Read from File o Write from File que utilice el mismo archivo de entrada o un archivo que tenga las mismas características que aquel en que usted esté trabajando actualmente. También puede usar el archivo de configuración con el ejecutor de trabajos para especificar la configuración del archivo durante la ejecución.

Para obtener información acerca de los comandos disponibles, consulte El archivo de configuración de definición de archivos.

Ficha Campos

La ficha Campos define los nombres, posiciones y, para los archivos secuenciales y de ancho fijo, la longitud de los campos en el archivo. Para obtener más información, consulte estos temas:

Ficha Ordenar campos

La ficha Ordenar campos define los campos según los cuales se ordenan los registros de entrada antes de ser enviados al flujo de datos. La ordenación es opcional. Para obtener más información, consulteOrdenación de los registros de entrada.

Ficha Tiempo de ejecución

Nombre de campo Descripción

Nombre de archivo

Muestra el nombre del archivo seleccionado en la primera ficha.

Starting record (Registro de inicio)

Si desea omitir los registros ubicados al comienzo del archivo cuando lee registros en el flujo de datos, especifique el primer registro que desea leer. Por ejemplo, si desea omitir los primeros 50 registros de un archivo, especifique 51. El registro número 51 será el primero que se leerá en el flujo de datos.

Todos los registros

Seleccione esta opción si desea leer todos los registros, comenzando desde el registro especificado en el campo Registro de inicio hasta el final del archivo.

Máximo de registros

Seleccione esta opción si desea leer solamente cierta cantidad de registros, comenzando desde el registro especificado en el campo Registro de inicio. Por ejemplo, si desea leer los primeros 100 registros, seleccione esta opción e ingrese 100.