Definición de campos para la lectura de Hive File
En la ficha Campos de la etapa Read from Hive File, se detallan los nombres de esquema, los tipos de datos, las posiciones y los nombres de los campos del archivo.
-
Haga clic en Regenerar.
En el caso de los archivos ORC, Avro y Parquet, esto genera un esquema basado en los metadatos de un archivo existente. En el caso de los archivos RC, se elimina cualquier campo que se haya agregado antes de hacer clic en Vista previa.
La cuadrícula muestra las columnas Nombre, Tipo, Campo de etapa e Incluir.
La columna Nombre muestra el nombre del campo, como se derivó del registro de encabezado del archivo.
La columna Tipo detalla los tipos de datos de cada respectivo campo del archivo.
La etapa admite los siguientes tipos de datos:
- boolean
- Tipo de dato lógico con dos valores: verdadero y falso
- fecha
- Un tipo de dato que contiene un mes, día y año. Por ejemplo, 2012-01-30 o 30 de enero, 2012. Puede especificar un formato de fecha predeterminado en Management Console.
- fecha y hora
- Un tipo de dato que contiene un mes, día, año y horas, minutos y segundos.
Por ejemplo, 2012/01/30 6:15 PM.
Nota: El tipo de datodatetime
en los mapas Spectrum para el tipo de datostimestamp
de los archivos Hive. - double
- Un tipo de dato numérico que contiene números de doble precisión tanto negativos como positivos entre 2-1074 y (2-2-52)×21023. En notación científica, el rango de valores es - 1.79769313486232E+308 a 1.79769313486232E+308.
- bigdecimal
- Un tipo de dato numérico que admite 38 puntos decimales de precisión. Utilice este tipo de datos para datos que se usarán en cálculos matemáticos que requieren un alto grado de precisión, especialmente aquellos que implican datos financieros. El tipo de datos bigdecimal es compatible con cálculos más precisos que el tipo de datos double.Nota: Para los archivos RC, Avro y Parquet Hive, los campos del tipo de dato
decimal
en el archivo de entrada se convierten a tipo de datobigdecimal
. - long
- Un tipo de datos numérico que contiene números enteros positivos y negativos entre -263 (-9,223,372,036,854,775,808) y 263-1 (9,223,372,036,854,775,807).Nota: El tipo de dato
long
en los mapas Spectrum para el tipo de datosbigint
de los archivos Hive. - integer
- Un tipo de datos numérico que contiene números enteros positivos y negativos entre -231 (-2,147,483,648) y 231-1 (2,147,483,647).
- float
- Un tipo de dato numérico que contiene números de precisión simple tanto negativos como positivos entre 2-149 y (2-223)×2127. En notación científica, el rango de valores es - 3.402823E+38 a 3.402823E+38.
- string
- Secuencia de caracteres.
Nota: En el caso de los archivos RC, no se admitenLa columna Posición muestra la posición inicial del campo respectivo de un registro.smallint
ni tipos de datos complejos. -
En la columna Campo de etapa, edite el nombre existente y cambie el nombre que desea para cada campo.
De forma predeterminada, esta columna muestra los nombres de campos como se leen del archivo.
-
En la columna Incluir, seleccione las casillas de verificación según los campos que desea incluir en los resultados de la etapa.
De forma predeterminada, todos los campos están seleccionados en esta columna.
-
Para los archivos RC, puede agregar y eliminar campos, y modificar las secuencias de las columnas seleccionadas en la salida con los botones que figuran a continuación:
Nombre de la opción
Descripción
Agregar
Agrega un campo a la salida.
Modificar
Modifica el nombre y el tipo de dato del campo seleccionado.
Quitar
Elimina el campo seleccionado de la salida.
Subir/Bajar
Reordena la posición del campo seleccionado en la salida.
Nota: Esta función solo está disponible para los archivos RC. - Haga clic en Aceptar.