入力シーケンシャルファイルのフィールドの定義

Read from Hadoop Sequence File ステージで、[フィールド] タブに、ファイル内のフィールドの名前、位置、タイプを定義します。[ファイルプロパティ] タブで入力ファイルを定義したら、フィールドを定義できます。

入力ファイルにヘッダレコードが含まれていない場合、またはフィールドを手動で定義する場合は、[フィールド] タブで以下の手順に従います。

入力ファイル内に既に存在するフィールドを定義するには、[再生成] をクリックします。その後、[検出タイプ] をクリックします。これにより、ファイルの最初の 50 個のレコードに基づいて、各フィールドのデータタイプが自動的に設定されます。
出力にフィールドを追加するには、[追加] をクリックします。
[名前] フィールドで、追加するフィールドを選択するか、フィールドの名前を入力します。
[タイプ] フィールドで、データに対して数学的な操作を行う予定がない場合は、データタイプを文字列のままにしておくことができます。ただし、そのような操作を行う予定がある場合は、適切なデータタイプを選択します。ファイルに含まれる文字列データは、データフローでの適切なデータ操作を可能にするデータタイプに変換されます。
このステージでは、以下のデータタイプがサポートされています。
double

正と負の倍精度数を含む数値データタイプ。値の範囲は、2^-1074 ～ (2-2^-52)×2¹⁰²³。指数表記すると、値の範囲は、-1.79769313486232E+308 ～ 1.79769313486232E+308 となります。

float

正と負の単精度数を含む数値データタイプ。値の範囲は、2^-149 ～ (2-2²³)×2¹²⁷。指数表記すると、値の範囲は、-3.402823E+38 ～ 3.402823E+38 となります。

integer

正と負の整数を含む数値データタイプ。値の範囲は、-2³¹ (-2,147,483,648) ～ 2³¹-1 (2,147,483,647)。

long

正と負の整数を含む数値データタイプ。値の範囲は、-2⁶³ (-9,223,372,036,854,775,808) ～ 2⁶³-1 (9,223,372,036,854,775,807)。

string

文字シーケンス。
[位置] フィールドで、レコード内のこのフィールドの位置を入力します。
例えば、この入力ファイルで、AddressLine1 は位置 1、City は位置 2、StateProvince は位置 3、PostalCode は位置 4 です。
```
"AddressLine1"|"City"|"StateProvince"|"PostalCode"
"7200 13TH ST"|"MIAMI"|"FL"|"33144"
"One Global View"|"Troy"|"NY"|12180
```
フィールドの値文字列の先頭と末尾から余分なスペース文字を削除するには、[トリム] チェックボックスをオンにします。

入力シーケンシャル ファイルのフィールドの定義

入力シーケンシャルファイルのフィールドの定義