Definición de campos para la lectura de Hive File

Haga clic en Regenerar.

En el caso de los archivos ORC, Avro y Parquet, esto genera un esquema basado en los metadatos de un archivo existente. En el caso de los archivos RC, se elimina cualquier campo que se haya agregado antes de hacer clic en Vista previa.

La cuadrícula muestra las columnas Nombre, Tipo, Campo de etapa e Incluir.

La columna Nombre muestra el nombre del campo, como se derivó del registro de encabezado del archivo.

La columna Tipo detalla los tipos de datos de cada respectivo campo del archivo.

La etapa admite los siguientes tipos de datos:

boolean: Tipo de dato lógico con dos valores: verdadero y falso
fecha: Un tipo de dato que contiene un mes, día y año. Por ejemplo, 2012-01-30 o 30 de enero, 2012. Puede especificar un formato de fecha predeterminado en Management Console.

fecha y hora: Un tipo de dato que contiene un mes, día, año y horas, minutos y segundos.
Por ejemplo, 2012/01/30 6:15 PM.

Nota: El tipo de datodatetime en los mapas Spectrum para el tipo de datostimestamp de los archivos Hive.
double: Un tipo de dato numérico que contiene números de doble precisión tanto negativos como positivos entre 2^-1074 y (2-2^-52)×2¹⁰²³. En notación científica, el rango de valores es - 1.79769313486232E+308 a 1.79769313486232E+308.
bigdecimal: Un tipo de dato numérico que admite 38 puntos decimales de precisión. Utilice este tipo de datos para datos que se usarán en cálculos matemáticos que requieren un alto grado de precisión, especialmente aquellos que implican datos financieros. El tipo de datos bigdecimal es compatible con cálculos más precisos que el tipo de datos double.
Nota: Para los archivos RC, Avro y Parquet Hive, los campos del tipo de dato decimal en el archivo de entrada se convierten a tipo de datobigdecimal.
long: Un tipo de datos numérico que contiene números enteros positivos y negativos entre -2⁶³ (-9,223,372,036,854,775,808) y 2⁶³-1 (9,223,372,036,854,775,807).
Nota: El tipo de datolong en los mapas Spectrum para el tipo de datosbigint de los archivos Hive.
integer: Un tipo de datos numérico que contiene números enteros positivos y negativos entre -2³¹ (-2,147,483,648) y 2³¹-1 (2,147,483,647).
float: Un tipo de dato numérico que contiene números de precisión simple tanto negativos como positivos entre 2^-149 y (2-2²³)×2¹²⁷. En notación científica, el rango de valores es - 3.402823E+38 a 3.402823E+38.
string: Secuencia de caracteres.

Nota: En el caso de los archivos RC, no se admiten smallint ni tipos de datos complejos.

La columna Posición muestra la posición inicial del campo respectivo de un registro.

En la columna Campo de etapa, edite el nombre existente y cambie el nombre que desea para cada campo.

De forma predeterminada, esta columna muestra los nombres de campos como se leen del archivo.

En la columna Incluir, seleccione las casillas de verificación según los campos que desea incluir en los resultados de la etapa.

De forma predeterminada, todos los campos están seleccionados en esta columna.

Para los archivos RC, puede agregar y eliminar campos, y modificar las secuencias de las columnas seleccionadas en la salida con los botones que figuran a continuación:

Nombre de la opción	Descripción
Agregar	Agrega un campo a la salida.
Modificar	Modifica el nombre y el tipo de dato del campo seleccionado.
Quitar	Elimina el campo seleccionado de la salida.
Subir/Bajar	Reordena la posición del campo seleccionado en la salida.

Nota: Esta función solo está disponible para los archivos RC.

Haga clic en Aceptar.