Standardisieren von Personennamen

Diese Schritte zeigen, wie Sie einen Datenfluss erstellen, der anhand von Personennamensdaten (z. B. „John P. Smith“) gemeinsame Rufnamen desselben Namens identifiziert und eine Standardversion des Namens erstellt, mit der sich dann redundante Datensätze konsolidieren lassen.

Anmerkung: Vergewissern Sie sich vorab, dass Ihre Eingabedaten ein Feld mit der Bezeichnung „Name“ umfassen, das den vollständigen Namen der Person enthält.
  1. Wenn Sie es nicht bereits getan haben, laden Sie die folgenden Tabellen in den Spectrum™ Technology Platform-Server:
    • Open Parser Base
    • Open Parser Enhanced Names

    Verwenden Sie das Database Load Utility des Data Normalization-Moduls, um diese Tabellen zu laden. Anleitungen zum Laden von Tabellen finden Sie im Installationshandbuch.

  2. Erstellen Sie im Enterprise Designer einen neuen Datenfluss.
  3. Ziehen Sie einen Quellschritt auf die Arbeitsfläche.
  4. Doppelklicken Sie auf den Quellschritt und konfigurieren Sie ihn. Anweisungen zum Konfigurieren von Quellschritten finden Sie im Datenfluss-Designer-Handbuch.
  5. Ziehen Sie einen „Open Name Parser“-Schritt auf die Arbeitsfläche und verbinden Sie ihn mit dem Quellschritt.

    Wenn Sie beispielsweise einen „Read from File“-Schritt verwenden, sieht Ihr Datenfluss folgendermaßen aus:

  6. Ziehen Sie einen „Table Lookup“-Schritt auf die Arbeitsfläche und verbinden Sie ihn mit dem „Open Name Parser“-Schritt.

    Ihr Datenfluss sollte nun folgendermaßen aussehen:

  7. Doppelklicken Sie auf den „Table Lookup“-Schritt auf der Arbeitsfläche.
  8. Wählen Sie im Feld Quelle den Eintrag FirstName aus.
  9. Wählen Sie im Feld Ziel den Eintrag FirstName aus.

    Durch Angeben desselben Feldes sowohl als Quelle als auch als Ziel wird das Feld mit der standardisierten Version des Namens aktualisiert.

  10. Wählen Sie im Feld Tabelle den Eintrag NickNames.xml aus.
  11. Klicken Sie auf OK.
  12. Klicken Sie erneut auf OK, um das Fenster Table Lookup-Optionen zu schließen.
  13. Ziehen Sie einen Datenladeschritt auf die Arbeitsfläche und verbinden Sie ihn mit dem „Table Lookup“-Schritt.

    Würden Sie beispielsweise eine „Write to File“-Datenladung verwenden, würde Ihr Datenfluss jetzt so aussehen:

  14. Doppelklicken Sie auf den Datenladeschritt und konfigurieren Sie ihn. Anweisungen zum Konfigurieren von Quellschritten finden Sie im Datenfluss-Designer-Handbuch.

Sie haben jetzt einen Datenfluss, der anhand von Personennamen den Vornamen standardisiert und Rufnamen durch die Standardform des Namens ersetzt.