Définition d'un ID non unique

Unique ID Generator permet de générer une clé non unique à l'aide d'un des algorithmes de génération de clé. Dans le mode non unique, vous pouvez créer des clés à utiliser pour la correspondance. Cela peut être utile dans un entrepôt de données dans lequel vous avez déjà ajouté des clés à une dimension et si vous souhaitez générer une clé pour les nouveaux enregistrements, afin de voir si les nouveaux enregistrements correspondent à un enregistrement existant.

  1. Dans le stage Unique ID Generator, sous l'onglet Règles, cliquez sur Modifier.
  2. Sélectionnez Désactivé.

    Cela désactive la partie ID unique des règles de génération d'ID. Avec cette option désactivée, seul l'algorithme que vous choisissez dans les étapes suivantes sera utilisé pour créer l'ID. Cela signifie que tout enregistrement doté des mêmes données dans les champs que vous utilisez pour générer l'ID disposera du même ID. Vous pouvez ensuite utiliser l'ID pour la mise en correspondance.

  3. Cliquez sur OK.
  4. À l'invite d'avertissement, cliquez sur Oui.
  5. Dans le stage Unique ID Generator, cliquez sur Ajouter.
  6. Dans le champ Algorithm, sélectionnez l'algorithme à utiliser pour générer d'autres informations dans l'ID. L'un des éléments suivants :
    Consonne
    Renvoie les champs indiqués, les consonnes étant supprimées.
    Metaphone double
    Renvoie un code basé sur la représentation phonétique de leurs caractères. Le double Metaphone est une version améliorée de l'algorithme Metaphone et tente de prendre en compte les nombreuses irrégularités de plusieurs langues.
    Koeln
    Noms d'index par son, tels qu'ils sont prononcés en allemand. Permet aux noms ayant la même prononciation d'être encodés avec la même représentation afin qu'ils puissent être mis en correspondance, en dépit de différences mineures au niveau de l'orthographe. Le résultat est toujours une séquence de nombres ; les caractères spéciaux et les espaces blancs sont ignorés. Cette option a été développée en réponse aux limites du Soundex.
    MD5
    Algorithme qui produit une valeur hash de 128 bits. Cet algorithme est généralement utilisé pour vérifier l'intégrité des données.
    Metaphone
    Renvoie une clé codée Metaphone des champs sélectionnés. Metaphone est un algorithme qui code les mots à l'aide de leur sonorité lorsque prononcé en anglais.
    Metaphone (Espagnol)
    Renvoie une clé codée Metaphone des champs sélectionnés pour la langue espagnole. Cet algorithme Metaphone code les mots à l'aide de leur sonorité lorsque prononcé en espagnol.
    Metaphone3
    Procède à une amélioration en fonction des algorithmes Metaphone et Double Metaphone avec des paramètres de consonne et de voyelle interne exacts qui vous permet de produire des mots ou des noms mis en correspondance de manière plus ou moins proche pour rechercher des termes au niveau phonétique. Metaphone 3 augmente l'exactitude de l'encodage phonétique à 98 %. Cette option a été développée en réponse aux limites du Soundex.
    Nysiis
    L'algorithme de code phonétique qui met en correspondance une prononciation approximative avec une orthographe exacte et indexe des mots prononcés de manière similaire. Fait partie du système New York State Identification and Intelligence System. Imaginons, par exemple, que vous recherchez des informations sur une personne dans une base de données de personnes. Vous pensez que le nom de la personne sonne comme « John Smith », mais il est en fait orthographié « Jon Smyth ». Si vous procédez à une recherche de la correspondance exacte de « John Smith », aucun résultat n'est renvoyé. Cependant, si vous indexez la base de données à l'aide de l'algorithme NYSIIS et procédez à une recherche en utilisant de nouveau l'algorithme NYSIIS, la correspondance correcte est renvoyée car « John Smith » et « Jon Smyth » sont indexés comme « JAN SNATH » par l'algorithme.
    Phonix
    Pré-traite les chaînes de nom en appliquant plus de 100 règles de transformation à des caractères uniques ou à des séquences de plusieurs caractères. 19 de ces règles s'appliquent uniquement si les caractères figurent au début de la chaîne, tandis que 12 des règles s'appliquent uniquement si les caractères figurent au milieu de la chaîne et 28 des règles s'appliquent uniquement si les caractères figurent à la fin de la chaîne. La chaîne de nom transformée est cryptée en un code composé d'une lettre au début, suivie de trois chiffres (en enlevant les zéros et les nombres en double). Cette option a été développée pour répondre aux limites de Soundex ; elle est plus complexe et donc plus lente que Soundex.
    Soundex
    Renvoie un code Soundex des champs sélectionnés. Soundex produit un code de longueur fixe en s'appuyant sur la sonorité du mot lorsque prononcé en anglais.
    Substring
    Renvoie une partie spécifié du champ sélectionné.
  7. Dans le champ Field name, choisissez le champ auquel appliquer l'algorithme. Par exemple, si vous choisissez l'algorithme soundex et un champ nommé City, l'ID sera généré en appliquant l'algorithme soundex aux données contenues dans le champ City.
  8. Si vous avez sélectionné l'algorithme de sous-chaîne, indiquez la partie du champ à utiliser dans la sous-chaîne :
    1. Dans le champ Start position, indiquez la position dans le champ où la sous-chaîne doit commencer.
    2. Dans le champ Length, sélectionnez le nombre de caractères à partir de la position de départ que vous souhaitez inclure dans la sous-chaîne.

      Par exemple, imaginons que vous disposez des données suivantes dans un champ nommé Nom de famille :

      Augustine

      Si vous avez indiqué 3 comme position de départ et 6 comme position de fin, la sous-chaîne produirait ce qui suit :

      gustin

  9. Cochez la case Supprimer les caractères de bruit pour supprimer tous les caractères non numériques et non alpha, tels que les traits d'union, les espaces blancs et autres caractères spéciaux du champ avant d'appliquer l'algorithme.
  10. Pour les algorithmes de consonne et de sous-chaîne, vous pouvez trier les données dans le champ avant d'appliquer l'algorithme en cochant la case Sort input. Vous pouvez alors choisir de trier les caractères dans le champ ou les termes dans le champ par ordre alphabétique.
  11. Cliquez sur OK pour enregistrer vos paramètres.
  12. Répétez les étapes autant de fois que nécessaire, si vous souhaitez ajouter d'autres algorithmes pour produire un ID plus complexe.
    Remarque : La définition de clé unique est toujours affichée d'une couleur différente et ne peut pas être supprimée.