例: マッチ分析の使用

この例では、マッチ分析ツールを使用して 2 種類のマッチのリフト/ドロップ率を比較する方法を示します。マッチャーを通じてデータを送信する前に、Broadcaster を使ってデータを 2 つのストリームに分割します。その後、それぞれのストリームを Intraflow Match ステージを通じて送信します。各データ ストリームには、同一の処理済みデータが含まれます。各 Intraflow Match ステージでは、異なるマッチング アルゴリズムを使い、さまざまなマッチのリフト/ドロップに使えるマッチ分析データが生成されます。



このサンプル データフローは Enterprise Designer で使用できます。[ファイル] > [新規作成] > [データフロー] > [テンプレートから作成] に移動し、[HouseholdRelationshipsAnalysis] を選択します。このデータフローでは、Advanced Matching モジュール、Data Normalization モジュール、および Universal Name モジュールが必要です。また、このデータフローでは、Table Lookup Core データベースと Open Parser Base テーブルをロードする必要もあります。

この例を使用するには:

  1. データフローを実行します。
  2. [ツール] > [マッチ分析] を選択します。
  3. [マッチ結果を表示] ウィンドウで [HouseholdRelationshipAnalysis] を展開し、[ソース] リストから [Household Match 1][Household Match 2] を選択してから [追加] をクリックします。
  4. [マッチ結果] リストで [Household Match 1] を選択し、[比較] をクリックします。サマリ結果が表示されます。
  5. [リフト/ドロップ] タブをクリックします。リフト/ドロップ グラフが表示されます。


    このグラフには、異なるマッチ ルールを使って生成された重複レコードとユニーク レコードとの相違が示されます。

  6. [マッチ ルール] タブをクリックします。マッチ ルールの比較が表示されます。


    このタブからは、アルゴリズムが変更されたことが読み取れます。[Character Frequency (文字出現回数)] がオフになり、[Exact Match (完全一致)] が追加されています。

  7. [詳細] をクリックします。
  8. 表示リストで [重複コレクション] を選択してから、[更新] をクリックします。
  9. [CollectionNumber] を展開して、重複コレクションごとに [サスペクト] のレコードと [重複] のレコードを表示します。


  10. 詳細ビューのコレクションを、作成した出力ファイルと比較します。