個人名の正規化

この手順では、個人名データ (例: "John P.Smith") を受け取り、同じ名前の共通ニックネームを識別して、冗長レコードの統合に使用できる名前の正規化バージョンを作成するデータフローの作成方法を示します。

注: 始める前に、入力データに個人のフル ネームが含まれる "Name" という名前のフィールドがあることを確認してください。
  1. 以下のテーブルをまだ Spectrum™ Technology Platform サーバーにロードしていない場合は、ロードします。
    • Open Parser Base
    • Open Parser Enhanced Names

    Data Normalization モジュールのデータベース ロード ユーティリティを使用して、これらのテーブルをロードします。テーブルのロード手順については、『 インストール ガイド』を参照してください。

  2. Enterprise Designer で、新しいデータフローを作成します。
  3. ソース ステージをキャンバスにドラッグします。
  4. ソース ステージをダブルクリックして設定します。ソース ステージの設定手順については、『データフロー デザイナー ガイド』を参照してください。
  5. Open Name Parser ステージをキャンバス上にドラッグし、ソース ステージに接続します。

    例えば、Read from File ステージを使用する場合、データフローは次のようになります。

    Read from File in dataflow
  6. Table Lookup ステージをキャンバスにドラッグし、Open Name Parser ステージに接続します。

    すると、データフローは次のようになるはずです。

    Open Name Parser connects to Table Lookup connected in dataflow
  7. キャンバス上の Table Lookup ステージをダブルクリックします。
  8. [ソース] フィールドで FirstName を選択します。
  9. [デスティネーション] フィールドで FirstName を選択します。

    ソースとデスティネーションの両方に同じフィールドを指定することにより、フィールドは名前の正規化されたバージョンで更新されます。

  10. [テーブル] フィールドで NickNames.xml を選択します。
  11. [OK] をクリックします。
  12. [OK] を再度クリックし、[Table Lookup オプション] ウィンドウを閉じます。
  13. シンク ステージをキャンバスにドラッグし、Table Lookup ステージに接続します。

    例えば、Write to File シンクを使用した場合、データフローは次のようになります。

    Write to File in dataflow
  14. シンク ステージをダブルクリックして設定します。ソース ステージの設定手順については、『データフロー デザイナー ガイド』を参照してください。

個人名を受け取り、名を正規化して、ニックネームを名前の標準バージョンで置き換えるデータフローができました。