Read From File
Read from File ステージでは、ジョブまたはサブフローの入力ファイルを指定します。これをサービスで使うことはできません。
- Management Console または Metadata Insights を用いてこれらのファイル サーバーへの接続を作成します。詳細については、「接続の定義」セクションを参照してください。
- [ファイル プロパティ] タブの [ファイル名] フィールドを使用してファイルを選択します (以下を参照)。
[ファイル プロパティ] タブ
フィールド名 | 説明 |
---|---|
サーバ名 | 入力として選択したファイルが Enterprise Designer を実行しているコンピュータ上にあるか、Spectrum™ Technology Platform サーバー上にあるかを示します。ローカル コンピュータ上のファイルを選択した場合、サーバー名はマイ コンピュータになります。サーバー上のファイルを選択した場合、サーバー名は Spectrum™ Technology Platform になります。 |
ファイル名 | ファイルへのパスを指定します。省略記号ボタン (...) をクリックし、目的のファイルを選択します。 ワイルド カード文字を使用して、ディレクトリ内の複数のファイルからデータを読み込むことができます。サポートされているワイルド カード文字は、* と ? です。例えば、*.csv と指定して、ディレクトリ内にある、拡張子が HDFS ファイル サーバーからのファイルの読み込みでサポートされる圧縮形式を次に示します。
注: ファイルの拡張子は、そのファイルの解凍に使用される圧縮形式を示します。 重要: なお、Spectrum™ Technology Platform サーバーを実行しているプラットフォームが Unix または Linux の場合、これらのプラットフォームでファイル名およびパスの大文字と小文字が区別されることに注意してください。 |
レコード タイプ | ファイル内のレコードのフォーマット。次のいずれかを選択します。
|
文字エンコーディング | テキスト ファイルのエンコーディング。次のいずれかを選択します。
|
フィールド区切り文字 | 区切り記号付きファイル内のフィールドを区切るのに使用する文字を指定します。例えば、次のレコードでは (|) 記号がフィールド区切り文字として使われています。
フィールド区切り文字として定義できるのは次の文字です。
これ以外の文字がフィールド区切り文字として使われているファイルについては、省略記号ボタン (...) をクリックし、別の文字を区切り文字として選択してください。 |
Text qualifier |
区切り記号付きファイル内のテキスト値を囲むのに使用する文字。 例えば、次のレコードでは二重引用符 (") がテキスト修飾子として使われています。
テキスト修飾子として定義できるのは次の文字です。
これ以外の文字がテキスト修飾子として使われているファイルについては、省略記号ボタン (...) をクリックし、別の文字をテキスト修飾子として選択してください。 |
レコード区切り文字 |
順次ファイルまたは区切り記号付きファイル内のレコードを区切るのに使用する文字を指定します。[デフォルトの EOL を使用] チェック ボックスをオンにすると、このフィールドは使用できません。 使用できるレコード区切り文字の設定は次のとおりです。
これ以外の文字がレコード区切り文字として使われているファイルについては、省略記号ボタン (...) をクリックし、別の文字をレコード区切り文字として選択してください。 |
デフォルトの EOL を使用 |
Spectrum™ Technology Platform サーバーが実行されているオペレーティング システムのデフォルトの行末 (EOL) 文字をファイルのレコード区切り文字として使用します。 ファイルの EOL 文字がサーバーのオペレーティング システムで使われているデフォルトの EOL 文字と異なる場合は、このオプションをオンにしないでください。例えば、ファイルで Windows の EOL が使われていて、サーバーの動作プラットフォームが Linux の場合は、このオプションをオンにしないでください。代わりに、[レコード区切り文字] フィールドで [Windows] オプションを選択します。 |
レコード長 |
固定長ファイルでは、個々のレコードの文字数を指定します。 行順次ファイルでは、ファイル内の最も長いレコードの長さ (文字数) を指定します。 |
最初の行はヘッダ レコード |
区切り記号付きファイルの先頭レコードの内容がデータではなくヘッダ情報であるかどうかを指定します。 次のファイル スニペットは、先頭レコードのヘッダー行の例です。
|
フィールド数が定義よりも少ないレコードを、形式誤りとみなす |
区切り記号付きファイルのレコードのうち、[フィールド] タブに定義されている数よりもフィールド数が少ないレコードを形式に誤りのあるレコードとみなします。 |
インポート |
ファイル レイアウト定義、エンコーディング設定、およびソート オプションを設定ファイルからインポートします。設定ファイルは、同じ入力ファイル、あるいは操作しているファイルと同じレイアウトを持つファイルを使用した、別の Read from File ステージまたは Write to File ステージから設定をエクスポートすることによって作成されます。 |
エクスポート |
ファイル レイアウト定義、エンコーディング設定、およびソート オプションを設定ファイルに保存します。その後、同じ入力ファイル、または現在操作しているファイルと同じ特性を持つファイルを使用する他の Read from File ステージまたは Write to File ステージにこれらの設定をインポートできます。Job Executor で設定ファイルを使用して、実行時にファイル設定を指定することもできます。 設定ファイルの詳細については、ファイル定義設定ファイルを参照してください。 |
[フィールド] タブ
[フィールド] タブでは、ファイル内の各フィールドの名前と位置を定義します。また、固定長ファイルと行順次ファイルについては、さらにフィールドの長さを定義します。詳細については、以下を参照してください。
[ソート フィールド] タブ
[ソート フィールド] タブでは、データフローに送出される前の入力レコードのソートに使うフィールドを定義します。ソートを行うかどうかはオプションです。詳細については、「入力レコードのソート」を参照してください。
[実行時] タブ
フィールド名 | 説明 |
---|---|
ファイル名 |
最初のタブで選択したファイル名が表示されます。 |
開始レコード |
レコードをデータフローに読み込むときファイルの先頭部分にあるレコードをスキップしたければ、読み込みたい最初のレコードを指定します。例えば、最初の 50 個のレコードをスキップする場合は 51 と指定します。これで 51 番目のレコードがデータフローに読み込まれる最初のレコードとなります。 |
すべてのレコード |
[開始レコード] フィールドで指定したレコードからファイルの最後までのレコードをすべて読み込む場合は、このオプションをオンにします。 |
最大レコード数 |
[開始レコード] フィールドで指定したレコードを起点にそこから一定の数のレコードを読み込む場合は、このオプションをオンにします。例えば、最初の 100 個のレコードを読み込みたい場合は、このオプションをオンにして 100 と入力します。 |