Définition des champs du stage Writing to Hive File

L'onglet Champs du stage Write to Hive File répertorie les noms de schéma et les types de données des champs des données d'entrées du stage.

  1. Pour sélectionner les champs de votre choix dans les données d'entrée ou un fichier existant, cliquez sur Ajout rapide.
    1. Sélectionnez les champs spécifiques à partir des données d'entrée.
    2. Cliquez sur OK.
  2. Pour ajouter de nouveaux champs, cliquez sur Ajouter.
    1. Saisissez le Nom du champ.
    2. Sélectionnez le Type du champ. Le stage prend en charge les types de données suivants :
      booléen
      Type logique doté de deux valeurs : True et False.
      date
      Type de données contenant un mois, un jour et une année. Par exemple, 2012-01-30 ou January 30, 2012. Vous pouvez indiquer un format de date par défaut dans Management Console.
      datetime
      Type de données contenant un mois, un jour, une année et des heures, des minutes et des secondes. Par exemple, 2012/01/30 6:15 PM.
      Remarque : Dans les fichiers Parquet, les types de données datetime ettime sont mappés sous forme de String. Dans les fichiers RC, le type de données datetime est mappé sous forme de timestamp.
      double
      Un type de données numérique qui contient à la fois des nombres en double précision négatifs et positifs entre 2-1074 et (2-2-52)×21023. En notation E, la plage de valeurs est comprise entre -1.79769313486232E+308 et 1.79769313486232E+308.
      flottant
      Un type de données numérique contenant des nombres de précision seuls négatifs et positifs entre 2-149 et (2-223)×2127. En notation E, la plage de valeurs est comprise entre -3.402823E+38 et 3.402823E+38.
      integer
      Un type de données numériques qui contient à la fois des nombres entiers négatifs et positifs entre -231 (-2,147,483,648) et 231-1 (2,147,483,647).
      bigdecimal
      Type de données numérique prenant en charge 38 points de précision décimaux. Utilisez ce type de données pour les données utilisées dans les calculs mathématiques requérant un haut niveau de précision, en particulier ceux impliquant des données financières. Le type de données bigdecimal prend en charge des calculs plus précis que le type de données double.
      Remarque : Pour les fichiers RC, Avro et Parquet Hive, le type de données bigdecimal est converti en type de données decimal à une précision 38 et une échelle 10.
      long
      Un type de données numériques qui contient à la fois des nombres entiers négatifs et positifs entre -263 (-9,223,372,036,854,775,808) et 263-1 (9,223,372,036,854,775,807).
      Remarque : Dans les fichiers RC, le type de données long est mappé sous forme de type de données bigint.
      chaîne
      Séquence de caractères.
    3. Dans le champ Position, entrez la position de ce champ dans l'enregistrement.

      Par exemple, dans ce fichier d'entrée, AddressLine1 est en position 1, City est en position 2, StateProvince est en position 3, et PostalCode est en position 4.

      "AddressLine1"|"City"|"StateProvince"|"PostalCode"
      "7200 13TH ST"|"MIAMI"|"FL"|"33144"
      "One Global View"|"Troy"|"NY"|12180
  3. Si vous écrasez un fichier existant, cliquez sur Régénérer pour récupérer le schéma du fichier existant, puis modifiez-le.
    Cette opération génère le schéma en fonction des métadonnées du fichier existant, s'il s'agit de fichiers de sortie ORC et Parquet. Pour les fichiers de sortie RC, vous devez explicitement ajouter les champs pour remplacer les champs existants.

    La colonne Nom répertorie les noms des différentes colonnes des données d'entrée. La colonne Type répertorie les types de données de chaque champ respectif des données d'entrée.

    Remarque : En cas de type de fichier Parquet, une autre colonne Annulable indique si le champ est annulable ou non. Vous pouvez cochez cette case pour un champ donné rendre le champ annulable, ou la décochez dans le cas contraire.
  4. Vous pouvez modifier les noms, les types de données et les séquence des colonnes sélectionnées dans la sortie en utilisant les boutons ci-dessous :

    Nom de l'option

    Description

    Ajouter

    Ajoute un champ dans la sortie.

    Modifier

    Modifie le nom et le type de données du champ sélectionné.

    Supprimer

    Enlève le champ sélectionné de la sortie.

    Déplacer vers le haut/Déplacer vers le bas

    Réorganise la position du champ sélectionné dans la sortie.

  5. Cliquez sur OK.