Standardvergleichsmethode

Mithilfe der vom Benutzer festgelegten Option „Gruppieren nach“ werden beim Vergleich Gruppen von Datensätzen identifiziert, die eventuell Dubletten voneinander sind. Beim Vergleich wird anschließend jeder Datensatz in der Gruppe untersucht. Wenn der Datensatz mit einer vorhandenen Kopfdublette übereinstimmt, wird dieser Datensatz als Dublette dieser Kopfdublette eingeordnet, erhält eine Punktzahl, Sammlungsnummer und einen Vergleichsdatensatztyp (Dublette) und wird anschließend aus dem Vergleich entfernt. Wenn der Datensatz jedoch mit keiner vorhandenen Kopfdublette innerhalb der Übereinstimmungsgruppe übereinstimmt, wird der Datensatz als eine neue Kopfdublette eingeordnet, indem er zur aktuellen Übereinstimmungsgruppe hinzugefügt wird, damit er mit nachfolgenden Datensätzen abgeglichen werden kann. Wenn beim Vergleich alle Datensätze in der aktuellen Übereinstimmungsgruppe untersucht wurden, werden alle Kopfdubletten aus dem Vergleich entfernt, ihr Vergleichsdatensatztyp wird als „Eindeutig“ markiert und sie erhalten die Sammlungsnummer 0. Diese Kopfdubletten mit mindestens einer Dublette bleiben als Vergleichsdatensatztyp „Kopfdublette“ erhalten und ihnen wird dieselbe Sammlungsnummer wie ihrer übereinstimmenden Datensatzdublette zugewiesen. Wenn schließlich alle Datensätze innerhalb einer Übereinstimmungsgruppe in die Ausgabe geschrieben wurden, wird eine neue Übereinstimmungsgruppe verglichen.

Anmerkung: Die standardmäßige Vergleichsmethode vergleicht nur Datensätze, die sich innerhalb derselben Übereinstimmungsgruppe befinden.

Der Vergleichstyp (Intraflow oder Interflow) bestimmt, wie Ergebnisse aus dem Schnellschlüsselvergleich in die Kandidatenpunktzahl umgewandelt werden. Beim Interflow-Vergleich überträgt ein erfolgreicher Schnellschlüsselvergleich stets ein MatchScore von 100 auf den Kandidaten. Auf der anderen Seite hängt beim Intraflow-Vergleich die Punktzahl, die ein Kandidat infolge eines Schnellschlüsselvergleichs erzielt, davon ab, ob der Datensatz, mit dem der Kandidat übereinstimmte, die Übereinstimmung einer anderen Kopfdublette war. Schnellschlüssel-Dubletten einer Kopfdublette erzielen immer ein MatchScore von 100, während Schnellschlüssel-Dubletten eines anderen Kandidaten (bei dem es sich um eine Dublette einer Kopfdublette handelte) den MatchScore (nicht unbedingt 100) dieses Kandidaten übernehmen werden.