オプション
以下の表に、Filter ステージのオプションを示します。
オプション名 |
説明 / 有効な値 |
---|---|
グループ化方法 |
フィルタリングするレコードのグループを作成するのに使用するフィールドを指定します。Filter ステージでは、ステージの設定方法に応じて各グループのレコードを 1 つ以上保持します。データフローで以前、Interflow Match、Intraflow Match、Transactional Match などのマッチング ステージを使用していた場合は、CollectionNumber フィールドを選択して、そのマッチング ステージで作成されたコレクションをグループとして使用する必要があります。ただし、別のフィールドによってレコードをグループ化する場合は、そのフィールドを選択します。例えば、AccountNumber フィールドの値が同じであるレコードを残し、それ以外のレコードをフィルタリングしてすべて除外する場合は、AccountNumber を選択します。 |
ソート |
[グループ化] フィールドにフィールドを指定する場合は、このボックスをオンにして、選択したフィールドの値でレコードをソートします。このオプションは、デフォルトで有効になっています。 |
詳細設定 |
ソート パフォーマンス オプションを指定するには、このボタンをクリックします。デフォルトでは、Management Console で指定されたソート パフォーマンス オプション (システム用のデフォルトのパフォーマンス オプション) が有効になります。システムのデフォルトのパフォーマンス オプションよりも優先する場合は、[ソート パフォーマンス オプションをオーバーライド] ボックスをオンにし、以下のフィールドに値を指定します。
注: 最適なソート パフォーマンスの設定は、サーバーのハードウェア構成によって異なります。次の式を一般的なガイドラインとして使用することで、妥当なソート パフォーマンスが得られます。(InMemoryRecordLimit × MaxNumberOfTempFiles ÷ 2) >= TotalNumberOfRecords
|
返される重複レコード数の上限値 |
各グループから返されるレコードの最大数を指定します。このオプションを 1 に設定すると、フィルタ ルールを定義して、グループごとに返す必要があるレコードを決定できます。ルールを定義しないと、各コレクションの先頭のレコードが返されて、残りのレコードは破棄されます。このモードでは、フィルタ ルールは保持するレコードを定義します。 例えば、グループ内でマッチ スコアが最も高いレコードを保持するルールを定義し、このオプションを 1 に設定すると、各グループ内でマッチ スコアが最も高いレコードが保持され、グループ内のそれ以外のレコードは破棄されます。 このオプションを 2 以上の値に設定すると、フィルタ ルールを指定できません。 注: 定義したルールの条件を満たすレコードがコレクションになければ、レコードはグループから返されません。
|
コレクションから重複を削除 |
フィルタ ルールを使用して、コレクションから削除するレコードを決定します。コレクション内の残りのレコードは保持されます。このオプションを選択するときは、ルールを定義する必要があります。 注: グループ内にレコードが 1 つしかない場合は、フィルタ ルールは無視され、そのレコードが保持されます。
|
ルール オプション
フィルタ ルールでは、グループ内に保持または削除するレコードを決定します。[返される重複レコード数の上限値] オプションを選択すると、ルールは保持するレコードを決定します。[コレクションから重複を削除] オプションを選択すると、ルールはデータフローから削除するレコードを決定します。
ルールを追加するには、ルール階層内のルールを選択し、[ルールの追加] をクリックします。
複数のルールを指定する場合は、各ルールの間で使用する論理演算子を選択する必要があります。新しいルールと前のルールの両方に合格しないと、条件を満たしていると判断しないように設定する場合は、[And] を選択します。前のルールまたは新しいルールのいずれか一方に合格すれば、条件を満たしていると判断するように設定する場合は、[Or] を選択します。
オプション | 説明 |
---|---|
フィールド名 |
レコードをフィルタリングするかどうかを判断するために値を評価するデータフロー フィールドの名前を指定します。 |
フィールド タイプ |
フィールドのデータのタイプを指定します。次のいずれかです。
|
演算子 |
フィールドの評価で使用する比較のタイプを指定します。次のいずれかです。
|
値タイプ |
フィールドの値と比較する値のタイプを指定します。次のいずれかです。 注: このオプションは、演算子として [最高]、[最低]、または [最長] を選択している場合は使用できません。
|
値 |
フィールドの値と比較する値を指定します。[フィールド タイプ] フィールドで [フィールド] を選択した場合は、データフロー フィールドを選択します。[値タイプ] フィールドで [文字列] を選択した場合は、比較で使用する値を入力します。 注: このオプションは、演算子として [最高]、[最低]、または [最長] を選択している場合は使用できません。
|
フィルタ ルールの例
このルールは、各グループで MatchScore フィールドの値が最も高いレコードを保持します。[演算子] が [最高] または [最低] の場合、[値] および [値タイプ] オプションは適用されないことに注意してください。
フィールド名 = MatchScore
フィールド タイプ = 数値
演算子 = 最高
このルールは、AccountNumber の値が "12345" のレコードを保持します。
フィールド名 = AccountNumber
フィールド タイプ = 数値
演算子 = が次に等しい
値タイプ = 文字列
値 = 12345