入力レコードをフィルタリング

Read from Hadoop Sequence File ステージで、[フィルタ] タブを使い、データフローに送出される前の入力レコードのフィルタに使うフィールドを定義します。フィルタを行うかどうかはオプションです。

  1. Read from Hadoop Sequence File で、[フィルタ] タブをクリックします。
  2. [式の結合方法] フィールドで、すべての式が真として評価される場合にのみ、このポートにレコードを送信するときは [すべて] を選択し、1 つ以上の式が真として評価される場合に、このポートにレコードを送信するときは [いずれか] を選択します。
  3. [追加] をクリックし、テストするフィールド、演算子、および値を指定します。演算子を次の表に示します。
    演算子 説明

    等しい

    フィールドの値が指定された値とマッチするかどうかを確認します。
    が次の値と異なる

    フィールドの値が指定された値とマッチしないかどうかを確認します。

    が次の値より大きい

    フィールドの数値が指定された値よりも大きいかどうかを確認します。この演算子は、数値データ タイプおよび数字を含む文字列フィールドに対してのみ適用できます。

    が次の値以上

    フィールドの数値が指定された値以上かどうかを確認します。この演算子は、数値データ タイプおよび数字を含む文字列フィールドに対してのみ適用できます。

    が次の値より小さい

    フィールドの数値が指定された値未満かどうかを確認します。この演算子は、数値データ タイプおよび数字を含む文字列フィールドに対してのみ適用できます。
    が次の値以下

    フィールドの数値が指定された値以下かどうかを確認します。この演算子は、数値データ タイプおよび数字を含む文字列フィールドに対してのみ適用できます。

    が NULL である フィールドが NULL 値かどうかを確認します。

    が NULL でない

    フィールドが NULL 値でないかどうかを確認します。
  4. 必要に応じて、[トリム] オプションを選択します。このオプションは、フィールドのデータのフィルタリングを行う前に、フィールドの値の前後の空白文字をトリムします。
  5. フィルタリングに使用するすべての入力フィールドを追加するまでこれを繰り返します。