複数のマッチ ルールによるレコードのマッチング
レコードのマッチングに複数のマッチング操作を使う必要がある場合、複数のマッチ キーを使うデータフローを作成し、その結果を組み合わせると実質的に複数の条件によるマッチングを行えます。例えば、レコードのマッチング条件として、
名前と住所の一致
または
誕生日と政府発行 ID の一致をデータフローで使うとします。
このロジックでマッチングを実行するには、名前と住所のマッチングをあるステージで実行し、誕生日と政府発行 ID のマッチングを別のステージで実行してから、双方でマッチングしたレコードを 1 つのコレクションに収めるデータフローを作成します。
ここでは、2 つのマッチング ステージを通じてマッチングを処理するデータフローを設定する一般的な手順を説明します。この手順を具体的に説明するため、ここでは Intraflow Match ステージを使用しますが、同じテクニックは Interflow Match ステージにも応用できます。
- Enterprise Designer で、新しいデータフローを作成します。
- ソース ステージをキャンバスにドラッグします。
- ソース ステージをダブルクリックして設定します。ソース ステージの設定手順については、『データフロー デザイナー ガイド』を参照してください。
-
最初のマッチング処理を定義します。最初のマッチング処理の結果は、最初のマッチング条件を満たすレコード、つまりここでは名前と住所が条件を満たすレコードのコレクションになります。
-
最初のマッチング処理で得られたコレクション番号を別のフィールドに保存します。こうするのは、2 番目のマッチング処理で CollectionNumber フィールドが上書きされるからです。最初のマッチング処理の結果を保持するには、CollectionNumber フィールドの名前を変更する必要があります。
-
2 番目のマッチング処理を定義します。2 番目のマッチング処理の結果は、2 番目のマッチング条件を満たすレコード、つまりここでは誕生日と政府発行 ID が条件を満たすレコードのコレクションになります。
-
2 番目のマッチング処理で重複レコードが見つかった場合、最初のマッチング処理でもそれが重複レコードとされていたかどうかを確認してください。
- Stream Combiner の後、どちらかのマッチング処理でマッチングしたレコードのコレクションが完成します。CollectionNumberConsolidated フィールドを見れば、マッチング レコードかどうかがわかります。Stream Combiner ステージの後に、必要であればシンクや追加の処理を追加できます。