Write to Hadoop Sequence File

Write to Hadoop Sequence File ステージでは、データフローからデータが出力としてシーケンシャルファイルに書き込まれます。シーケンシャルファイルは、キー/値ペアで構成されるフラットファイルです。詳細については、wiki.apache.org/hadoop/SequenceFile を参照してください。

注: Write to Hadoop Sequence File ステージは、Hadoop 分散ファイルシステム (HDFS) 上にある区切り記号付きの未圧縮シーケンシャルファイルのみをサポートします。

[ファイルプロパティ] タブ

フィールド	説明
サーバー	[ファイル名] フィールドで指定したファイルが Hadoop システム上にあることを示します。このステージでこれを使用する前に、Management Console で Hadoop ファイルサーバーへの接続を作成しておく必要があります。Hadoop システム上のファイルを選択すると、そのサーバー名が、ファイルサーバーの作成時に Management Console で指定する名前になります。
ファイル名	ファイルへのパスを指定します。省略記号ボタン (...) をクリックし、必要なファイルを参照して選択します。
フィールド区切り文字	区切り記号付きファイル内のフィールドを区切るのに使用する文字を指定します。例えば、次のレコードでは (\|) 記号がフィールド区切り文字として使われています。 `7200 13TH ST\|MIAMI\|FL\|33144` フィールド区切り文字として定義できるのは次の文字です。スペースタブカンマピリオド (.) セミコロンパイプ (\|) これ以外の文字がフィールド区切り文字として使われているファイルについては、省略記号ボタン (...) をクリックし、別の文字を区切り文字として選択してください。
Text qualifier	区切り記号付きファイル内のテキスト値を囲むのに使用する文字。例えば、次のレコードでは二重引用符 (") がテキスト修飾子として使われています。 `"7200 13TH ST"\|"MIAMI"\|"FL"\|"33144"` テキスト修飾子として定義できるのは次の文字です。一重引用符 (') 二重引用符 (") これ以外の文字がテキスト修飾子として使われているファイルについては、省略記号ボタン (...) をクリックし、別の文字をテキスト修飾子として選択してください。

[フィールド] タブ

[フィールド] タブでは、ファイルの各フィールドの名前、位置、およびタイプを定義します。詳細については、出力シーケンシャルファイルのフィールドの定義

Write to Hadoop Sequence File

[ファイル プロパティ] タブ

[フィールド] タブ

[ファイルプロパティ] タブ