入力シーケンシャル ファイルのフィールドの定義

Read from Hadoop Sequence File ステージで、[フィールド] タブに、ファイル内のフィールドの名前、位置、タイプを定義します。[ファイル プロパティ] タブで入力ファイルを定義したら、フィールドを定義できます。

[フィールド] タブでは、ファイルの各フィールドの名前と位置、またファイルの種類によっては、さらにフィールドの長さも定義します。[ファイル プロパティ] タブで入力ファイルを定義したら、フィールドを定義できます。

  1. 出力にフィールドを追加するには、[追加] をクリックします。
  2. [タイプ] フィールドで、データに対して数学的な操作を行う予定がない場合は、データ タイプを文字列のままにしておくことができます。ただし、そのような操作を行う予定がある場合は、適切なデータ タイプを選択します。ファイルに含まれる文字列データは、データフローでの適切なデータ操作を可能にするデータ タイプに変換されます。
    このステージでは、以下のデータ タイプがサポートされています。
    double
    正と負の倍精度数を含む数値データ タイプ。値の範囲は、2-1074 ~ (2-2-52)×21023。指数表記すると、値の範囲は、-1.79769313486232E+308 ~ 1.79769313486232E+308 となります。
    float
    正と負の単精度数を含む数値データ タイプ。値の範囲は、2-149 ~ (2-223)×2127。指数表記すると、値の範囲は、-3.402823E+38 ~ 3.402823E+38 となります。
    integer
    正と負の整数を含む数値データ タイプ。値の範囲は、-231 (-2,147,483,648) ~ 231-1 (2,147,483,647)。
    long
    正と負の整数を含む数値データ タイプ。値の範囲は、-263 (-9,223,372,036,854,775,808) ~ 263-1 (9,223,372,036,854,775,807)。
    string
    文字シーケンス。
  3. [名前] フィールドで、追加するフィールドを選択するか、フィールドの名前を入力します。