Interflow ジョブ
Interflow Match は、2 つの入力レコード ストリーム内の類似するデータ レコード間でマッチを検出します。最初のレコード ストリームはサスペクト レコードのソースで、2 番目のストリームは候補レコードのソースです。
Interflow Match では、マッチ グループ条件 (マッチ キー等) を使用して、特定のサスペクト レコードと重複する可能性があるレコードのグループを識別します。
レポート
Interflow Match ジョブを使用して、ジョブの結果を監視することができます。使用可能なカウンタは次の通りです:- DUPLICATE_COLLECTIONS
- コレクション番号によってグループ化されたサスペクトレコードとその重複レコードで構成される、重複コレクションの数。
- EXPRESS_MATCHES
- 1 つのコレクションで作成された Express マッチの数。
Express マッチは、サスペクトと候補が指定されたフィールド内の内容に正確にマッチした場合に作成され、通常は ExpressMatchKey が Match Key Generator によって提供されます。Express マッチが作成された場合、サスペクトと候補の重複を判定するためのそれ以上の処理は行われません。
- AVERAGE_SCORE
- すべての重複の平均マッチ スコア。
有効な値は 0 ~ 100 です。0 は精度の低いマッチを意味し、100 は完全一致を意味します。
- INPUT_SUSPECTS
- マッチャーが他のレコードとの照合を試みた入力ストリーム内のレコードの数。
- SUSPECTS_WITH_DUPLICATES
- 少なくとも 1 つの候補レコードと一致した入力サスペクトの数。
- UNIQUE_SUSPECTS
- どの候補レコードとも一致しなかった入力サスペクトの数。
- SUSPECTS_WITH_CANDIDATES
- マッチ グループ内に候補レコードが少なくとも 1 つある、つまり照合の試みが少なくとも 1 回は行われた入力サスペクトの数。
- SUSPECTS_WITHOUT_CANDIDATES
- マッチ グループ内に候補レコードがない、つまり照合の試みが行われなかった入力サスペクトの数。
- TOTAL_DUPLICATE_CANDIDATES
- 検出された重複候補の総数。
- TOTAL_DUPLICATE_SCORE
- すべての重複の合計マッチ スコア。