Write to Hadoop Sequence File
Write to Hadoop Sequence File ステージでは、データフローからデータが出力としてシーケンシャル ファイルに書き込まれます。シーケンシャル ファイルは、キー/値ペアで構成されるフラット ファイルです。詳細については、wiki.apache.org/hadoop/SequenceFile を参照してください。
注: Write to Hadoop Sequence File ステージは、Hadoop 分散ファイル システム (HDFS) 上にある区切り記号付きの未圧縮シーケンシャル ファイルのみをサポートします。
[ファイル プロパティ] タブ
フィールド | 説明 |
---|---|
サーバー | [ファイル名] フィールドで指定したファイルが Hadoop システム上にあることを示します。このステージでこれを使用する前に、Management Console で Hadoop ファイル サーバーへの接続を作成しておく必要があります。Hadoop システム上のファイルを選択すると、そのサーバー名が、ファイル サーバーの作成時に Management Console で指定する名前になります。 |
ファイル名 | ファイルへのパスを指定します。省略記号ボタン (...) をクリックし、必要なファイルを参照して選択します。 |
フィールド区切り文字 |
区切り記号付きファイル内のフィールドを区切るのに使用する文字を指定します。 例えば、次のレコードでは (|) 記号がフィールド区切り文字として使われています。
フィールド区切り文字として定義できるのは次の文字です。
これ以外の文字がフィールド区切り文字として使われているファイルについては、省略記号ボタン (...) をクリックし、別の文字を区切り文字として選択してください。 |
Text qualifier |
区切り記号付きファイル内のテキスト値を囲むのに使用する文字。 例えば、次のレコードでは二重引用符 (") がテキスト修飾子として使われています。
テキスト修飾子として定義できるのは次の文字です。
これ以外の文字がテキスト修飾子として使われているファイルについては、省略記号ボタン (...) をクリックし、別の文字をテキスト修飾子として選択してください。 |
[フィールド] タブ
[フィールド] タブでは、ファイルの各フィールドの名前、位置、およびタイプを定義します。詳細については、出力シーケンシャル ファイルのフィールドの定義