可変フォーマット データのフラット化

多くの場合、可変フォーマット ファイル データには、1 つのレコード タイプがその他のレコード タイプの親となっている、階層的関係を持つレコードが含まれます。多くのステージではフラット形式のデータが必要とされるので、下流のステージで使えるようにするためにデータをフラット化しなければならないこともあります。例えば、次の入力データを考えます。

001   Joe,Smith,M,100 Main St,555-234-1290
100   CHK12904567,12/2/2007,6/1/2012,CHK
200   1000567,1/5/2012,Fashion Shoes,323.12
001   Anne,Johnson,F,1202 Lake St,555-222-4932
100   CHK238193875,1/21/2001,4/12/2012,CHK
200   1000232,3/5/2012,Blue Goose Grocery,132.11
200   1000232,3/8/2012,Trailway Bikes,540.00

トランザクションごとに 1 レコードとなるように、レコードをフラット化できます。上記の例では、トランザクション レコード (タグ 200 のレコード) を受け入れ、アカウント所有者情報 (タグ 001 のレコード) とアカウント詳細 (タグ 100 のレコード) を含めるようにフラット化することを意味します。

次の手順は、Splitter ステージを使用してレコードをフラット化する方法を説明したものです。

  1. Read from Variable Format File ステージをデータ フローに追加して、設定します。詳細については、Read from Variable Format Fileを参照してください。
  2. Splitter ステージを追加して、Read from Variable Format File に接続します。
  3. 入力データ内の子レコード タイプごとに 1 つの Splitter ステージとなるように、必要に応じて Splitter ステージを追加します。
  4. すべての Splitter ステージを接続します。

    データ フローは次のようになっているはずです。

  5. 最初の Splitter ステージをダブルクリックして、ステージのオプション を開きます。
  6. [分割位置] フィールドで、いずれかの子レコード タイプを選択します。
  7. [OK] をクリックします。
  8. 追加した Splitter ステージをそれぞれ設定し、各 Splitter の [分割位置] フィールドで異なる子レコード タイプを選択します。