Hive ファイル書き込みのためのフィールドの定義

Write to Hive File ステージの [フィールド] タブには、ステージへの入力データに含まれるフィールドのスキーマ名とデータタイプが一覧表示されます。

  1. 入力データ、または既存のファイルから必要なフィールドを選択する場合は、[クイック追加] をクリックします。
    1. 目的のフィールドを入力データから選択します。
    2. [OK] をクリックします。
  2. 新しいフィールドを追加する場合は、[追加] をクリックします。
    1. フィールドの [名前] を入力します。
    2. フィールドの [タイプ] を選択します。このステージでは、以下のデータ タイプがサポートされています。
      boolean
      true と false の 2 つの値を持つ論理タイプ。
      date
      月、日、年を含むデータ タイプ。例: 2012-01-30、January 30, 2012。デフォルトの日付の形式は Management Console で指定できます。
      datetime
      月、日、年、時、分、秒を含むデータ タイプ。例: 2012/01/30 6:15 PM。
      注: Parquet ファイルでは、datetimetime のデータタイプは String としてマッピングされます。RC ファイルでは、datetime データタイプは timestamp としてマッピングされます。
      double
      正と負の倍精度数を含む数値データ タイプ。値の範囲は、2-1074 ~ (2-2-52)×21023。指数表記すると、値の範囲は、-1.79769313486232E+308 ~ 1.79769313486232E+308 となります。
      float
      正と負の単精度数を含む数値データ タイプ。値の範囲は、2-149 ~ (2-223)×2127。指数表記すると、値の範囲は、-3.402823E+38 ~ 3.402823E+38 となります。
      integer
      正と負の整数を含む数値データ タイプ。値の範囲は、-231 (-2,147,483,648) ~ 231-1 (2,147,483,647)。
      bigdecimal
      小数点以下 38 桁の精度をサポートする数値データ タイプ。高い精度が必要な算術計算で使用されるデータ (特に金融データ) には、このデータ タイプを使用してください。bigdecimal データ タイプは、double データ タイプより正確な計算をサポートします。
      注: RC、Avro、Parquet Hive ファイルに対し、bigdecimal データ タイプは、有効桁数が 38 で小数点以下桁数 が 10 の decimal データ タイプに変換されます。
      long
      正と負の整数を含む数値データ タイプ。値の範囲は、-263 (-9,223,372,036,854,775,808) ~ 263-1 (9,223,372,036,854,775,807)。
      注: RC ファイルでは、long データタイプは bigint データタイプとしてマッピングされます。
      string
      文字シーケンス。
    3. [位置] フィールドで、レコード内のこのフィールドの位置を入力します。

      例えば、この入力ファイルで、AddressLine1 は位置 1、City は位置 2、StateProvince は位置 3、PostalCode は位置 4 です。

      "AddressLine1"|"City"|"StateProvince"|"PostalCode"
      "7200 13TH ST"|"MIAMI"|"FL"|"33144"
      "One Global View"|"Troy"|"NY"|12180
  3. 既存ファイルを上書きする場合は、[再生成] をクリックして既存ファイルからスキーマを取得してから、それを変更します。
    これによって ORC と Parquet の出力ファイルの場合は、既存ファイルのメタデータに基づくスキーマが生成されます。RC 出力ファイルの場合は、既存フィールドを上書きするには、フィールドを明示的に追加する必要があります。

    [名前] 列には、入力データのさまざまな列の名前が表示されます。[タイプ] 列には、入力データの各フィールドのデータタイプが表示されます。

    注: Parquet ファイル タイプの場合は、もう 1 つの列である [Null 可] によって、フィールドに Null が設定可能かどうかが示されます。特定のフィールドのこのチェックボックスをオンにすることによって、そのフィールドに Null を設定可能にできます。それ以外の場合はこのチェックボックスをオフにします。
  4. 出力される列の名前、データタイプ、または順序を次のボタンを使って変更できます。

    オプション名

    説明

    追加

    フィールドを出力に追加します。

    変更

    選択されているフィールドの名前とデータタイプを変更します。

    削除

    選択されたフィールドを出力から削除します。

    上へ移動/下へ移動

    選択されているフィールドの出力時の並び順を変更します。

  5. [OK] をクリックします。