Definición de campos para la lectura de Hive File

En la ficha Campos de la etapa Read from Hive File, se detallan los nombres de esquema, los tipos de datos, las posiciones y los nombres de los campos del archivo.

  1. Haga clic en Regenerar.
    En el caso de los archivos ORC, Avro y Parquet, esto genera un esquema basado en los metadatos de un archivo existente. En el caso de los archivos RC, se elimina cualquier campo que se haya agregado antes de hacer clic en Vista previa.

    La cuadrícula muestra las columnas Nombre, Tipo, Campo de etapa e Incluir.

    La columna Nombre muestra el nombre del campo, como se derivó del registro de encabezado del archivo.

    La columna Tipo detalla los tipos de datos de cada respectivo campo del archivo.

    La etapa admite los siguientes tipos de datos:

    boolean
    Tipo de dato lógico con dos valores: verdadero y falso
    fecha
    Un tipo de dato que contiene un mes, día y año. Por ejemplo, 2012-01-30 o 30 de enero, 2012. Puede especificar un formato de fecha predeterminado en Management Console.
    fecha y hora
    Un tipo de dato que contiene un mes, día, año y horas, minutos y segundos.

    Por ejemplo, 2012/01/30 6:15 PM.

    Nota: El tipo de datodatetime en los mapas Spectrum para el tipo de datostimestamp de los archivos Hive.
    double
    Un tipo de dato numérico que contiene números de doble precisión tanto negativos como positivos entre 2-1074 y (2-2-52)×21023. En notación científica, el rango de valores es - 1.79769313486232E+308 a 1.79769313486232E+308.
    bigdecimal
    Un tipo de dato numérico que admite 38 puntos decimales de precisión. Utilice este tipo de datos para datos que se usarán en cálculos matemáticos que requieren un alto grado de precisión, especialmente aquellos que implican datos financieros. El tipo de datos bigdecimal es compatible con cálculos más precisos que el tipo de datos double.
    Nota: Para los archivos RC, Avro y Parquet Hive, los campos del tipo de dato decimal en el archivo de entrada se convierten a tipo de datobigdecimal.
    long
    Un tipo de datos numérico que contiene números enteros positivos y negativos entre -263 (-9,223,372,036,854,775,808) y 263-1 (9,223,372,036,854,775,807).
    Nota: El tipo de datolong en los mapas Spectrum para el tipo de datosbigint de los archivos Hive.
    integer
    Un tipo de datos numérico que contiene números enteros positivos y negativos entre -231 (-2,147,483,648) y 231-1 (2,147,483,647).
    float
    Un tipo de dato numérico que contiene números de precisión simple tanto negativos como positivos entre 2-149 y (2-223)×2127. En notación científica, el rango de valores es - 3.402823E+38 a 3.402823E+38.
    string
    Secuencia de caracteres.
    Nota: En el caso de los archivos RC, no se admiten smallint ni tipos de datos complejos.
    La columna Posición muestra la posición inicial del campo respectivo de un registro.
  2. En la columna Campo de etapa, edite el nombre existente y cambie el nombre que desea para cada campo.
    De forma predeterminada, esta columna muestra los nombres de campos como se leen del archivo.
  3. En la columna Incluir, seleccione las casillas de verificación según los campos que desea incluir en los resultados de la etapa.
    De forma predeterminada, todos los campos están seleccionados en esta columna.
  4. Para los archivos RC, puede agregar y eliminar campos, y modificar las secuencias de las columnas seleccionadas en la salida con los botones que figuran a continuación:

    Nombre de la opción

    Descripción

    Agregar

    Agrega un campo a la salida.

    Modificar

    Modifica el nombre y el tipo de dato del campo seleccionado.

    Quitar

    Elimina el campo seleccionado de la salida.

    Subir/Bajar

    Reordena la posición del campo seleccionado en la salida.

    Nota: Esta función solo está disponible para los archivos RC.
  5. Haga clic en Aceptar.