Einführung in die Datenqualität

Zur Datenqualität gehört es, die Genauigkeit, Aktualität, Vollständigkeit und Konsistenz der von einer Organisation verwendeten Daten sicherzustellen, damit die Daten nutzbar sind. Spectrum™ Technology Platform unterstützt Initiativen für höhere Datenqualität mithilfe der folgenden Funktionen.

Parsen

Parsing ist der Prozess des Analysierens einer Sequenz von Eingabezeichen in einem Feld und des Aufspaltens des Feldes in mehrere Felder. Beispielsweise verfügen Sie möglicherweise über das Feld „Name“, das den Wert „John A. Smith“ enthält. Durch Parsing können Sie das Feld so aufspalten, dass Sie über das Feld „FirstName“ verfügen, das „John“ enthält, über das Feld „MiddleName“, das „A“ enthält“, und über das Feld „LastName“, das „Smith“ enthält.

Standardisierung

Bei der Standardisierung werden Daten desselben Typs einheitlich formatiert. Einige Datentypen, die standardisiert werden können, umfassen Telefonnummern, Datumswerte, Namen, Adressen und Identifikationsnummern. Beispielsweise können Telefonnummern formatiert werden, um nicht numerische Zeichen wie Klammern, Punkte oder Bindestriche zu entfernen.

Sie sollten Ihre Daten standardisieren, bevor Sie Vergleichs- oder Deduplizierungsaktivitäten durchführen, da standardisierte Daten genauer abgeglichen werden als uneinheitlich formatierte Daten.

Vergleichen

Beim Vergleichen werden Datensätze identifiziert, die auf irgendeine Weise zusammenhängen, die für Ihre Zwecke relevant ist. Wenn Sie beispielsweise versuchen, redundante Informationen aus Ihren Kundendaten zu entfernen, können Sie doppelte Datensätze für denselben Kunden identifizieren. Oder: Wenn Sie verhindern möchten, dass doppelte Marketingmaterialien an die gleiche Adresse gehen, können Sie Datensätze von Kunden identifizieren, die im gleichen Haushalt leben.

Deduplizierung

Bei der Deduplizierung werden Datensätze identifiziert, die eine Entität darstellen, aber aus unterschiedlichen Gründen mehrmals in das System eingegeben wurden, manchmal mit geringfügig unterschiedlichen Daten. So kann Ihr System etwa Lieferanteninformationen von verschiedenen Abteilungen Ihrer Organisation enthalten, wobei jede Abteilung eine andere Lieferanten-ID für denselben Lieferanten verwendet. Mit Spectrum™ Technology Platform können Sie diese Datensätze in einem einzelnen Datensatz für jeden Lieferanten konsolidieren.

Überprüfung von Ausnahmedatensätzen

In einigen Fällen können Sie Daten haben, die nicht zuverlässig automatisch verarbeitet und vom Data Steward überprüft werden müssen. Einige Beispiele für Datensätze, die eine manuelle Überprüfung erfordern, sind:
  • Fehler bei Adressenüberprüfungen
  • Fehler beim Geocoding
  • Übereinstimmungen mit niedrigem Zuverlässigkeitsniveau
  • Zusammenführungs-/Konsolidierungsentscheidungen

Das Business Steward-Modul besteht aus einer Reihe von Features, mit denen Sie Ausnahmedatensätze identifizieren und auflösen können.