Hive ファイル読み取りのためのフィールドの定義

Read from Hive File ステージの [フィールド] タブには、スキーマ名、データタイプ、位置、およびファイル内で指定されているフィールドの名前が表示されます。

  1. [再生成] をクリックします。
    ORC ファイル、Avro ファイル、Parquet ファイルの場合は、これによって、既存ファイルのメタデータに基づくスキーマが生成されます。RC ファイルの場合は、[プレビュー] をクリックする前に追加したすべてのフィールドがクリアされます。

    グリッドには、[名前][タイプ][ステージ フィールド][含める] の各列が表示されます。

    [名前] 列には、ファイルのヘッダ レコードから取得されたフィールド名が表示されます。

    [タイプ] 列には、ファイルの各フィールドのデータタイプが表示されます。

    このステージでは、以下のデータ タイプがサポートされています。

    boolean
    true と false の 2 つの値を持つ論理タイプ。
    date
    月、日、年を含むデータ タイプ。例: 2012-01-30、January 30, 2012。デフォルトの日付の形式は Management Console で指定できます。
    datetime
    月、日、年、時、分、秒を含むデータ タイプ。

    例: 2012/01/30 6:15 PM。

    注: Spectrum の datetime データタイプは、Hive ファイルの timestamp データタイプにマッピングされます。
    double
    正と負の倍精度数を含む数値データ タイプ。値の範囲は、2-1074 ~ (2-2-52)×21023。指数表記すると、値の範囲は、-1.79769313486232E+308 ~ 1.79769313486232E+308 となります。
    bigdecimal
    小数点以下 38 桁の精度をサポートする数値データ タイプ。高い精度が必要な算術計算で使用されるデータ (特に金融データ) には、このデータ タイプを使用してください。bigdecimal データ タイプは、double データ タイプより正確な計算をサポートします。
    注: RC ファイル、Avro ファイル、Parquet Hive ファイルの場合、入力ファイル内の decimal データタイプのフィールドは、bigdecimal データタイプに変換されます。
    long
    正と負の整数を含む数値データ タイプ。値の範囲は、-263 (-9,223,372,036,854,775,808) ~ 263-1 (9,223,372,036,854,775,807)。
    注: Spectrum の long データタイプは、Hive ファイルの bigint データタイプにマッピングされます。
    integer
    正と負の整数を含む数値データ タイプ。値の範囲は、-231 (-2,147,483,648) ~ 231-1 (2,147,483,647)。
    float
    正と負の単精度数を含む数値データ タイプ。値の範囲は、2-149 ~ (2-223)×2127。指数表記すると、値の範囲は、-3.402823E+38 ~ 3.402823E+38 となります。
    string
    文字シーケンス。
    注: RC ファイルの場合、smallint データタイプと複合データタイプはサポートされません。
    [位置] 列には、レコード内における各フィールドの開始位置が表示されます。
  2. [ステージ フィールド] 列では、各フィールドの既存のフィールド名を任意の名前に編集できます。
    デフォルトで、この列にはファイルから読み込まれたフィールド名が表示されます。
  3. [含める] 列で、ステージの出力に含めるフィールドのチェックボックスを選択します。
    デフォルトで、この列はすべてのフィールドで選択されています。
  4. RC ファイルの場合は、以下のボタンを使用して、フィールドを追加または削除したり、出力における選択列の順序を変更したりできます。

    オプション名

    説明

    追加

    フィールドを出力に追加します。

    変更

    選択されているフィールドの名前とデータタイプを変更します。

    削除

    選択されたフィールドを出力から削除します。

    上へ移動/下へ移動

    選択されているフィールドの出力時の並び順を変更します。

    注: この機能は、RC ファイルに対してのみ使用可能です。
  5. [OK] をクリックします。