Definición de campos para la escritura de Hive File
En la ficha Campos de la etapa Write to Hive File, se detallan los nombres de esquema y tipos de datos de los campos en los datos de entrada de la etapa.
-
Para seleccionar los campos deseados en los datos de entrada, o un archivo existente, haga clic en Agregado rápido.
- Seleccione los campos específicos de los datos de entrada.
- Haga clic en Aceptar.
-
Para agregar nuevos campos, haga clic en Agregar.
- Ingrese el Nombre del campo.
-
Seleccione el Tipo del campo. La etapa admite los siguientes tipos de datos:
- boolean
- Tipo de dato lógico con dos valores: verdadero y falso
- fecha
- Un tipo de dato que contiene un mes, día y año. Por ejemplo, 2012-01-30 o 30 de enero, 2012. Puede especificar un formato de fecha predeterminado en Management Console.
- fecha y hora
- Un tipo de dato que contiene un mes, día, año y horas, minutos y segundos. Por ejemplo, 2012/01/30 6:15 PM.Nota: En los archivos Parquet, los tipos de datos
datetime
ytime
se asignan comoString
. En los archivos RC, el tipo de datosdatetime
se asigna comotimestamp
. - double
- Un tipo de dato numérico que contiene números de doble precisión tanto negativos como positivos entre 2-1074 y (2-2-52)×21023. En notación científica, el rango de valores es - 1.79769313486232E+308 a 1.79769313486232E+308.
- float
- Un tipo de dato numérico que contiene números de precisión simple tanto negativos como positivos entre 2-149 y (2-223)×2127. En notación científica, el rango de valores es - 3.402823E+38 a 3.402823E+38.
- integer
- Un tipo de datos numérico que contiene números enteros positivos y negativos entre -231 (-2,147,483,648) y 231-1 (2,147,483,647).
- bigdecimal
- Un tipo de dato numérico que admite 38 puntos decimales de precisión. Utilice este tipo de datos para datos que se usarán en cálculos matemáticos que requieren un alto grado de precisión, especialmente aquellos que implican datos financieros. El tipo de datos bigdecimal es compatible con cálculos más precisos que el tipo de datos double.Nota: Para los archivos RC, Avro y Parquet Hive, el tipo de dato
bigdecimal
se convierte en un tipo de datodecimal
con precisión de 38 y una escala 10.; - long
- Un tipo de datos numérico que contiene números enteros positivos y negativos entre -263 (-9,223,372,036,854,775,808) y 263-1 (9,223,372,036,854,775,807).Nota: En los archivos RC, el tipo de datos
long
se asigna como tipo de datosbigint
. - string
- Secuencia de caracteres.
-
En el campo Posición, ingrese la posición de este campo dentro del registro.
Por ejemplo, en este archivo de entrada, AddressLine1 está en posición 1; City, en posición 2; StateProvince, en posición 3; y PostalCode, en posición 4.
"AddressLine1"|"City"|"StateProvince"|"PostalCode" "7200 13TH ST"|"MIAMI"|"FL"|"33144" "One Global View"|"Troy"|"NY"|12180
-
Si sobrescribe un archivo existente, haga clic en Regenerar para seleccionar el esquema del archivo existente, y luego modifíquelo.
Esto genera un esquema basado en los metadatos de un archivo existente, en el caso de los archivos de salida ORC y Parquet. Para los archivos de salida RC, debe agregar los campos de forma explícita para sobrescribir los campos existentes.
La columna Nombre detalla los nombres de las diversas columnas de los datos de entrada. La columna Tipo detalla los tipos de datos de cada campo de los datos de entrada respectivamente.
Nota: En el caso del tipo de archivo Parquet, otra columna Nulo indica si el campo es nulo o no. Puede marcar esta casilla de verificación para un campo particular a fin de hacer que el campo sea nulo o desmarcarla. -
Puede modificar los nombres, tipos de datos y secuencia de las columnas seleccionadas en la salida utilizando los siguientes botones:
Nombre de la opción
Descripción
Agregar
Agrega un campo a la salida.
Modificar
Modifica el nombre y el tipo de dato del campo seleccionado.
Quitar
Elimina el campo seleccionado de la salida.
Subir/Bajar
Reordena la posición del campo seleccionado en la salida.
- Haga clic en Aceptar.