Standardisieren von Begriffen

Die inkonsistente Verwendung von Begriffen kann ein Datenqualitätsproblem sein, das Schwierigkeiten beim Parsen, bei Suchvorgängen und mehr verursacht. Sie können einen Datenfluss erstellen, der Begriffe in Ihren Daten findet, die inkonsistent verwendet werden, und sie standardisieren. Wenn Ihre Daten etwa die Begriffe „Incorporated“, „Inc.“ und „Inc“ enthalten, können Sie einen Datenfluss erstellen, um eine Form als Standardform festzulegen (z. B. „Inc.“).

Anmerkung: Vor Ausführen dieser Prozedur muss Ihr Administrator die Datenbank des Data Normalization-Moduls installieren, die standardisierte Begriffe enthält, die auf Ihre Daten angewendet werden sollen. Eine Anleitung zum Installieren von Datenbanken finden Sie im Installationshandbuch.
  1. Erstellen Sie im Enterprise Designer einen neuen Datenfluss.
  2. Ziehen Sie einen Quellschritt auf die Arbeitsfläche.
  3. Doppelklicken Sie auf den Quellschritt und konfigurieren Sie ihn. Anweisungen zum Konfigurieren von Quellschritten finden Sie im Datenfluss-Designer-Handbuch.
  4. Ziehen Sie einen „Table Lookup“-Schritt auf die Arbeitsfläche und verbinden Sie ihn mit dem Quellschritt.

    Bei Verwendung eines „Read from File“-Quellschrittes würde Ihr Datenfluss so aussehen:

  5. Doppelklicken Sie auf den „Table Lookup“-Schritt auf der Arbeitsfläche.
  6. Um die Optionen für „Table Lookup“ anzugeben, erstellen Sie eine Regel. Sie können mehrere Regeln erstellen und dann die Reihenfolge angeben, in der die Regeln angewendet werden sollen. Klicken Sie auf Hinzufügen, um eine Regel zu erstellen.
  7. Lassen Sie im Feld Aktion die Standardoption Standardisieren ausgewählt.
  8. Lassen Sie im Feld Für die Option Vollständiges Feld ausgewählt, wenn das ganze Feld der Begriff ist, den Sie standardisieren möchten. Oder wählen Sie Einzelne Begriffe im Feld, um einzelne Wörter im Feld zu standardisieren.
  9. Wählen Sie im Feld Quelle das Feld aus, das Sie standardisieren möchten.
  10. Wählen Sie im Feld Ziel das Feld aus, das den standardisierten Begriff enthalten soll. Wenn Sie dasselbe Feld wie das Quellenfeld angeben, wird der Wert des Quellenfeldes durch den standardisierten Begriff ersetzt.
  11. Wählen Sie im Feld Tabelle die Tabelle aus, die die standardisierten Begriffe enthält.
    Anmerkung: Wenn Sie die erforderliche Tabelle nicht sehen, setzen sich mit Ihrem Systemadministrator in Verbindung. Die Datenbank des Data Normalization-Moduls muss geladen sein.
  12. Wählen Sie im Feld Wenn Tabellenwert nicht gefunden wird, Zielwert festlegen auf die Option Quellwert aus.
  13. Klicken Sie auf OK.
  14. Definieren Sie zusätzliche Regeln, wenn Werte in mehr Feldern standardisiert werden sollen. Klicken Sie auf OK, wenn Sie alle Regeln definiert haben.
  15. Ziehen Sie einen Datenladeschritt auf die Arbeitsfläche und verbinden Sie ihn mit „Table Lookup“.

    Bei Verwendung von „Write to File“ würde Ihr Datenfluss so aussehen:

  16. Doppelklicken Sie auf den Datenladeschritt und konfigurieren Sie ihn.

    Informationen zum Konfigurieren von Datenladeschritten finden Sie im Datenfluss-Designer-Handbuch.

Sie haben jetzt einen Datenfluss, der Begriffe standardisiert.