出力レコードのソート

Write to File ステージで、[ソート フィールド] タブを使い、出力ファイルに書き出される前の出力レコードのソートに使うフィールドを定義します。ソートを行うかどうかはオプションです。

  1. Write to File で、[ソート フィールド] タブをクリックします。
  2. [追加] をクリックします。
  3. [フィールド名] 列のドロップダウン矢印をクリックし、ソートに使うフィールドを選択します。選択できるフィールドは、データフロー内のフィールドによって異なります。
  4. [順序] 列で、Ascending または Descending を選択します。
  5. ソートに使用するすべての出力フィールドを追加するまでこれを繰り返します。ソート順序を変更するには、移動するフィールドの行をハイライト表示して、[上へ] または [下へ] をクリックします。
  6. システムのデフォルトのソート パフォーマンス オプションの設定は、Management Console で行います。システムのデフォルトのソート パフォーマンス オプションをオーバーライドする場合は、[詳細設定] をクリックします。[詳細オプション] ダイアログ ボックスには、次のソート パフォーマンス オプションがあります。
    メモリ内レコードの上限値
    ソートでメモリ内に保持できるデータ行の最大数を指定します。この上限を越えると、ディスクにページングします。デフォルトでは、10,000 レコード未満のソートはメモリ内で行われ、10,000 レコードを越えるソートはディスク ソートとして実行されます。上限値は 100,000 レコードです。通常、メモリ内ソートはディスク ソートよりはるかに速いため、大部分のソートがメモリ内ソートとなり、大規模セットのみがディスクに書き出されるよう、この値を十分大きく設定してください。
    注: 複数のジョブを同時並行で実行する環境では、[メモリ内レコードの上限値] の設定を増やすと、メモリ不足になる可能性が高くなります。
    一時ファイルの最大数
    ソート プロセスで使用できる一時ファイルの最大数を指定します。使用する一時ファイルの数を増やすと、パフォーマンスが向上する可能性があります。ただし、最適なファイル数は Spectrum™ Technology Platform を実行しているサーバーの構成に大きく依存します。さまざまな設定を試して、使用する一時ファイル数の増減がパフォーマンスに与える影響を確認する必要があります。必要になる可能性がある一時ファイルの適切な数を計算するには、次の式を使用します。
    (NumberOfRecords × 2) ÷ InMemoryRecordLimit = NumberOfTempFiles 
    一時ファイルの最大数は 1,000 を超える値にはできないことに注意してください。
    圧縮を有効にする
    一時ファイルをディスクに書き込むときに圧縮します。
    注: 最適なソート パフォーマンスの設定は、サーバーのハードウェア構成によって異なります。それでも一般には、次の式で妥当なソート パフォーマンスが得られます。
    (InMemoryRecordLimit × MaxNumberOfTempFiles ÷ 2) >= TotalNumberOfRecords