形式に誤りのある入力レコードの管理

形式に誤りのあるレコードとは、Spectrum™ Technology Platform がパースできないレコードのことです。Spectrum™ Technology Platform は、形式に誤りのあるレコードを検出すると、次の 1 つ以上のタスクを行います。

  • ジョブを停止する
  • 処理を続行する
  • 不正なレコードが一定の数だけ検出されるまで処理を続行する
  • 不正なレコードを (オプションのシンク ステージによって) ログ ファイルに書き出して処理を続行する
注: 形式に誤りのあるレコードに対する機能は、サーバー上にあるファイルを読み込み、ソートが設定されていないソースに対してのみ適用されます。ソースにリモート ファイルが設定されているか、ソート フィールドが設定されている場合は、形式に誤りのあるレコードが検出されると、形式に誤りのあるレコードに対する設定に関わらず、ジョブは終了します。

形式に誤りのあるレコードを管理するには

  1. キャンバスでフローを開きます。
  2. 形式に誤りのあるレコード シンクをフローに追加します。
    1. 入力ファイルおよびソース ステージを定義し、フローにサービスおよびサブフローを追加することにより、ジョブを作成します。
    2. これで次のことができます。
      • フローのソース ステージのオプションの出力ポートに、シンク ステージを接続します。オプションのポートとは、ソース ステージの黒い出力ポートのすぐ下にある白抜きの出力ポートのことです。このポート上にマウスを合わせると、"error_port" と記されたツール チップが表示されます。形式に誤りのあるレコードは、このシンクに移動します。
      • フローのソース ステージのオプションの出力ポートに何も接続せず、形式に誤りのあるレコードをすべて無視します。
  3. デフォルトでは、形式に誤りのあるレコードが検出されると処理が停止します。このデフォルトの動作は、Management Console の [高度な設定] オプションで変更できます。システムのデフォルトの動作にかかわらず、ジョブのデフォルトの動作を以下の手順でオーバーライドすることができます。
    1. Flow Designer でジョブを開きます。
    2. 開いているジョブ内で、[編集] > [ジョブ オプション] を選択します。
    3. [形式に誤りのあるレコードでジョブを停止しない] を選択するか、または [形式に誤りのあるレコードを次の個数検出した時点でジョブを停止] を選択して、ジョブを停止するまでに検出してもよい形式に誤りのあるレコードの数を入力します。