グループの生成

このセクションでは、類似レコードのグループの生成および確認方法について説明します。これらのグループは、指定した [グループ強度] に基づいて生成されます。低い強度を指定すると、関係性の薄い類似レコードも同じグループとして分類されるので、緩い関係の大きなグループが生成されます。強度を高くすると、関係性が強く、精度の高いグループが生成されます。グループ強度を非常に高い値に設定すると、どのレコードも同じグループに分類されず、単一のエントリを持つ複数のグループが生成されます。

グループを生成するには、次の手順を実行します。

  1. [グループの生成] ページで、スライダー バーを使用するか、または用意されているテキスト ボックスに強度を入力して [グループ強度] を指定します。
    注: [グループ強度] には、01 の値を指定できます。小数点以下第 2 位まで値を入力できます。
  2. ボタンをクリックします。
    生成されたグループがテーブル形式で表示されます。生成されたグループの合計数平均サイズ最小サイズ最大サイズなど、グループに関する追加情報が表示されます。[一意のグループ] の数も表示されます。
    注: 生成されたグループのリストから、単一のレコードを含むグループを非表示にするには、[一意のグループを非表示にする] チェック ボックスをオンにします。
  3. 生成されたグループを確認します。
    注: 生成されたグループを確認する際には、エンティティのグループ化したい類似のエントリが、ほぼ同じグループに分類されているか確認します。生成されたグループに満足できない場合は、グループ強度を変更して、グループを再生成します。完全に正確なグループを生成する必要はありません。これらのグループは次のステップへの入力として使用されます。次のステップでは、関連するレコードのペアが表示され、タグ付けを行うことができます。

    例: エンティティ [名] をグループ化したい場合、生成されたグループのほとんどに似たタイプの名が分類されているか確認します。適切に分類されていない場合は、[グループ強度] を変更してグループを再生成します。

  4. アイコンをクリックすると、変更が保存され、次のステージに移動します。
  5. 現在のタスクをキャンセルするには、 アイコンをクリックします。