マッチングの用語

平均スコア
すべての重複の平均マッチ スコア。有効な値は 0 ~ 100 です。0 は精度の低いマッチを意味し、100 は完全一致を意味します。
ベースライン
マッチした他の結果と比較するために選択したマッチ結果。
候補グループ
Candidate Finder が割り当てた ID でグループ化されたサスペクトまたは候補のレコード。サスペクト (そのグループの最初のレコード) は入力ソースから読み込まれたレコードですが、候補は通常、SQL クエリを使用してデータベースから取り出されたレコードです。
候補レコード
マッチ グループまたは候補グループ内にあるサスペクト以外のすべてのレコード。
ドロップ
重複の減少。
詳細マッチ レコード
マッチ ステージによって処理されたレコードに合致した 1 つのレコードのこと。各レコードは、そのマッチ グループまたは候補グループと出力コレクションの情報と共に、そのレコードがサスペクト、ユニーク、または重複のいずれであったかという情報を提供します。候補レコードは、なぜその入力レコードがサスペクトにマッチしたか、またはマッチしなかったかという情報を提供します。
重複コレクション
サスペクトとその重複レコードがコレクション番号によってグループ化されたもの。ユニーク レコードは常にコレクション番号 0 とされます。
重複レコード
マッチ グループ内で他のレコードとマッチしたレコード数。
Express マッチ
サスペクトと候補が指定されたフィールド内の内容に正確にマッチした場合に作成されるもののこと。通常は ExpressMatchKey が Match Key Generator によって提供されます。式マッチがそれ以上の処理がされず終了した場合、サスペクトと候補は重複していると判断できます。
入力レコード
マッチング ソート実行前のマッチング ステージにおけるレコードの順序。
Interflow Match
2 つの入力レコード ストリーム間で類似データ レコードのマッチを検出するマッチング ステージ。最初のレコード ストリームはサスペクト レコードのソースで、2 番目のストリームは候補レコードのソースです。
Intraflow Match
1 つの入力ストリーム内の類似データ レコードのマッチを検出するマッチング ステージ。
リフト
重複の増加。
マッチ グループ
(グループ化方法) マッチ キーまたはスライディング ウィンドウでグループ化されたレコード。
マッチ結果
(またはリソース バンドル) ステージで生成されたファイルの論理的グループ。このデータはステージの実行毎に保持され、ディスクに保存されます。次の実行では、前回の結果の上書きまたは変更はしません。MAT では、設定情報と同様にサマリと詳細結果に関する情報を提供するために使用されます。
マッチ結果リスト
MAT が現在の分析セッションで分析できる、1 種類のマッチ結果のリスト。
マッチ結果タイプ
マッチ結果の中身を示します。MAT はマッチ結果タイプを使用して、データの使用方法を決定します。
マッチャー ステージ
マッチング ルーチンを実行するキャンバス上のステージ。マッチャー ステージは Interflow Match、Intraflow Match、および Transactional Match です。
マッチでなくなったもの
以前は重複またはサスペクトとされていたが、現在はユニークとなっているレコード。
新しいマッチ
以前はユニークだったが、現在は重複またはサスペクトとされているレコード。
スライディング ウィンドウ
スライディング ウィンドウ マッチング方法は、ウィンドウというあらかじめ定められたバッファ サイズを、対応するデータ行で連続して埋めていきます。各行はウィンドウに追加され、既にウィンドウ内にあるアイテムと比較されます。
サスペクト レコード
マッチ グループまたは候補グループ内の候補と照合されるドライバ レコード。
Transactional Match
Candidate Finder または外部アプリケーションが返す候補レコードとサスペクト レコードを照合するマッチング ステージ。
ユニーク レコード
マッチ グループで他のレコードにマッチしないサスペクトまたは候補レコード。マッチ グループ内に 1 つしか存在していないレコードであれば、サスペクトは自動的にユニーク レコードとなります。