例: マッチ分析の使用
この例では、マッチ分析ツールを使用して 2 種類のマッチのリフト/ドロップ率を比較する方法を示します。マッチャーを通じてデータを送信する前に、Broadcaster を使ってデータを 2 つのストリームに分割します。その後、それぞれのストリームを Intraflow Match ステージを通じて送信します。各データ ストリームには、同一の処理済みデータが含まれます。各 Intraflow Match ステージでは、異なるマッチング アルゴリズムを使い、さまざまなマッチのリフト/ドロップに使えるマッチ分析データが生成されます。
このサンプル データフローは Enterprise Designer で使用できます。[HouseholdRelationshipsAnalysis] を選択します。このデータフローでは、Advanced Matching モジュール、Data Normalization モジュール、および Universal Name モジュールが必要です。また、このデータフローでは、Table Lookup Core データベースと Open Parser Base テーブルをロードする必要もあります。
に移動し、この例を使用するには:
- データフローを実行します。
- を選択します。
- [マッチ結果を表示] ウィンドウで [HouseholdRelationshipAnalysis] を展開し、[ソース] リストから [Household Match 1] と [Household Match 2] を選択してから [追加] をクリックします。
- [マッチ結果] リストで [Household Match 1] を選択し、[比較] をクリックします。サマリ結果が表示されます。
- [リフト/ドロップ] タブをクリックします。リフト/ドロップ グラフが表示されます。
このグラフには、異なるマッチ ルールを使って生成された重複レコードとユニーク レコードとの相違が示されます。
- [マッチ ルール] タブをクリックします。マッチ ルールの比較が表示されます。
このタブからは、アルゴリズムが変更されたことが読み取れます。[Character Frequency (文字出現回数)] がオフになり、[Exact Match (完全一致)] が追加されています。
- [詳細] をクリックします。
- 表示リストで [重複コレクション] を選択してから、[更新] をクリックします。
- 各 [CollectionNumber] を展開して、重複コレクションごとに [サスペクト] のレコードと [重複] のレコードを表示します。
- 詳細ビューのコレクションを、作成した出力ファイルと比較します。