Definición de campos para la escritura de Hive File

En la ficha Campos de la etapa Write to Hive File, se detallan los nombres de esquema y tipos de datos de los campos en los datos de entrada de la etapa.

  1. Para seleccionar los campos deseados en los datos de entrada, o un archivo existente, haga clic en Agregado rápido.
    1. Seleccione los campos específicos de los datos de entrada.
    2. Haga clic en Aceptar.
  2. Para agregar nuevos campos, haga clic en Agregar.
    1. Ingrese el Nombre del campo.
    2. Seleccione el Tipo del campo. La etapa admite los siguientes tipos de datos:
      boolean
      Tipo de dato lógico con dos valores: verdadero y falso
      fecha
      Un tipo de dato que contiene un mes, día y año. Por ejemplo, 2012-01-30 o 30 de enero, 2012. Puede especificar un formato de fecha predeterminado en Management Console.
      fecha y hora
      Un tipo de dato que contiene un mes, día, año y horas, minutos y segundos. Por ejemplo, 2012/01/30 6:15 PM.
      Nota: En los archivos Parquet, los tipos de datosdatetime ytime se asignan comoString. En los archivos RC, el tipo de datosdatetime se asigna comotimestamp.
      double
      Un tipo de dato numérico que contiene números de doble precisión tanto negativos como positivos entre 2-1074 y (2-2-52)×21023. En notación científica, el rango de valores es - 1.79769313486232E+308 a 1.79769313486232E+308.
      float
      Un tipo de dato numérico que contiene números de precisión simple tanto negativos como positivos entre 2-149 y (2-223)×2127. En notación científica, el rango de valores es - 3.402823E+38 a 3.402823E+38.
      integer
      Un tipo de datos numérico que contiene números enteros positivos y negativos entre -231 (-2,147,483,648) y 231-1 (2,147,483,647).
      bigdecimal
      Un tipo de dato numérico que admite 38 puntos decimales de precisión. Utilice este tipo de datos para datos que se usarán en cálculos matemáticos que requieren un alto grado de precisión, especialmente aquellos que implican datos financieros. El tipo de datos bigdecimal es compatible con cálculos más precisos que el tipo de datos double.
      Nota: Para los archivos RC, Avro y Parquet Hive, el tipo de dato bigdecimal se convierte en un tipo de dato decimal con precisión de 38 y una escala 10.;
      long
      Un tipo de datos numérico que contiene números enteros positivos y negativos entre -263 (-9,223,372,036,854,775,808) y 263-1 (9,223,372,036,854,775,807).
      Nota: En los archivos RC, el tipo de datos long se asigna como tipo de datosbigint.
      string
      Secuencia de caracteres.
    3. En el campo Posición, ingrese la posición de este campo dentro del registro.

      Por ejemplo, en este archivo de entrada, AddressLine1 está en posición 1; City, en posición 2; StateProvince, en posición 3; y PostalCode, en posición 4.

      "AddressLine1"|"City"|"StateProvince"|"PostalCode"
      "7200 13TH ST"|"MIAMI"|"FL"|"33144"
      "One Global View"|"Troy"|"NY"|12180
  3. Si sobrescribe un archivo existente, haga clic en Regenerar para seleccionar el esquema del archivo existente, y luego modifíquelo.
    Esto genera un esquema basado en los metadatos de un archivo existente, en el caso de los archivos de salida ORC y Parquet. Para los archivos de salida RC, debe agregar los campos de forma explícita para sobrescribir los campos existentes.

    La columna Nombre detalla los nombres de las diversas columnas de los datos de entrada. La columna Tipo detalla los tipos de datos de cada campo de los datos de entrada respectivamente.

    Nota: En el caso del tipo de archivo Parquet, otra columna Nulo indica si el campo es nulo o no. Puede marcar esta casilla de verificación para un campo particular a fin de hacer que el campo sea nulo o desmarcarla.
  4. Puede modificar los nombres, tipos de datos y secuencia de las columnas seleccionadas en la salida utilizando los siguientes botones:

    Nombre de la opción

    Descripción

    Agregar

    Agrega un campo a la salida.

    Modificar

    Modifica el nombre y el tipo de dato del campo seleccionado.

    Quitar

    Elimina el campo seleccionado de la salida.

    Subir/Bajar

    Reordena la posición del campo seleccionado en la salida.

  5. Haga clic en Aceptar.