Intraflow Match
Intraflow Match は、単一の入力ストリーム内の類似するデータ レコード間でマッチを検出します。データフローの別のコンポーネントで定義または作成したフィールドに基づいて、階層的なルールを作成できます。
レポート
Intraflow Match ジョブを使用して、ジョブの結果を監視することができます。使用可能なカウンタは次の通りです:- INPUT_RECORDS
- マッチング ソート実行前のマッチング ステージにおけるレコードの数。
- DUPLICATE_RECORDS
- マッチ グループ内の重複レコード (サスペクト レコードまたは候補レコード) の数。
- UNIQUE_RECORDS
- 各マッチ グループで他のレコードにマッチしないサスペクトまたは候補レコードの数。
マッチ グループ内に 1 つしか存在していないレコードであれば、サスペクトは自動的にユニーク レコードとなります。
- MATCH_GROUPS
- (グループ化) マッチ キーでグループ化されたレコード。
- DUPLICATE_COLLECTIONS
- コレクション番号によってグループ化されたサスペクトレコードとその重複レコードで構成される、重複コレクションの数。
- EXPRESS_MATCHES
- 1 つのコレクションで作成された Express マッチの数。
Express マッチは、サスペクトと候補が指定されたフィールド内の内容に正確にマッチした場合に作成され、通常は ExpressMatchKey が Match Key Generator によって提供されます。Express マッチが作成された場合、サスペクトと候補の重複を判定するためのそれ以上の処理は行われません。
- AVERAGE_SCORE
- すべての重複の平均マッチ スコア。
有効な値は 0 ~ 100 です。0 は精度の低いマッチを意味し、100 は完全一致を意味します。
- TOTAL_DUPLICATES
- 検出された重複の総数。
- TOTAL_SCORE
- すべての重複の合計マッチ スコア。