Uso de algoritmos para expandir una ID única

Unique ID Generator genera una ID única para cada registro con una numeración secuencial para cada registro o una marca de fecha y hora para cada registro. Opcionalmente, puede utilizar algoritmos para agregar información adicional a la ID única secuencial o de fecha y hora, creando así una ID única más compleja que es más probable que sea realmente irrepetible.

  1. En Unique ID Generator, haga clic en Agregar.
  2. En el campo Algoritmo, seleccione el algoritmo que desea utilizar para generar información adicional en la ID. Una de las siguientes:
    Consonante
    Devuelve campo especificados con consonantes eliminadas.
    Doble metaphone
    Devuelve un código basado en una representación fonética de sus caracteres. Double Metaphone es una versión mejorada del algoritmo Metaphone e intenta explicar la gran cantidad de irregularidades encontradas en los distintos idiomas.
    Koeln
    Indexa los nombres por sonido, tal como se los pronuncia en alemán. Permite que los nombres que tienen la misma pronunciación se codifiquen con la misma representación, de modo tal que puedan cruzarse a pesar de las pequeñas diferencias en el modo en que se escriben. El resultado es siempre una secuencia de números; los caracteres especiales y los espacios en blanco se ignoran. Esta opción se desarrolló para responder a las limitaciones de Soundex.
    MD5
    Un algoritmo de síntesis del mensaje que produce un valor hash de 128 bits. Este algoritmo suele usarse para comprobar la integridad de los datos.
    Metaphone
    Devuelve una clave codificada Metaphone de campos seleccionados. Metaphone es un algoritmo para codificar palabras utilizando su pronunciación del inglés.
    Metaphone (español)
    Devuelve una clave codificada Metaphone de campos seleccionados para el idioma español. El algoritmo Metaphone codifica palabras con base en su pronunciación en español.
    Metaphone 3
    Mejora los algoritmos de Metaphone y Double Metaphone con parámetros más exactos de consonantes y vocales internas que permiten pronunciar palabras y nombres que, fonéticamente, coinciden en mayor o menor medida con los términos de búsqueda. Metaphone 3 aumenta la precisión de la codificación fonética en un 98%. Esta opción se desarrolló para responder a las limitaciones de Soundex.
    Nysiis
    Algoritmo de codificación fonética que cruza una pronunciación aproximada con una palabra escrita exacta e indexa palabras que se pronuncian de manera similar. Parte del sistema de inteligencia e identificación del estado de Nueva York (New York State Identification and Intelligence System). Supongamos que está buscando información sobre alguien en una base de datos de personas. Cree que el nombre de esa persona suena algo así como "John Smith", pero en realidad se escribe "Jon Smyth". Si busca una coincidencia exacta para "John Smith" no obtendrá resultados. Sin embargo, si indexa la base de datos con el algoritmo de NYSIIS y realiza la búsqueda usando ese mismo algoritmo, obtendrá una coincidencia correcta porque el algoritmo indexa "John Smith" y "Jon Smyth" como "JAN SNATH".
    Phonix
    Preprocesa cadenas de nombres aplicando más de 100 reglas de transformación a caracteres únicos o secuencias de varios caracteres. Diecinueve de esas reglas se aplican solo si los caracteres se encuentran al comienzo de la cadena, mientras que 12 de ellas se aplican solo cuando los caracteres se encuentran en medio de la cadena, y 28 se aplican únicamente si están al final de la cadena. La cadena de nombre transformada se codifica en un código compuesto por la primera letra seguida de tres dígitos (sin ceros ni números duplicados). Esta opción se desarrolló como respuesta a las limitaciones de Soundex; es más compleja y, por lo tanto, más lenta que esta última.
    Soundex
    Devuelve un código Soundex de campos seleccionados. El algoritmo Soundex produce un código de longitud fija basado en la pronunciación en inglés de las palabras.
    Subcadena de caracteres
    Devuelve una porción específica del campo seleccionado.
  3. En el campo Campos de entrada, seleccione el campo al que desee aplicar el algoritmo. Por ejemplo, si selecciona el algoritmo soundex y elige un campo denominado Ciudad, el código se generaría aplicando el algoritmo soundex para los datos en el campo Ciudad.
  4. Si seleccionó el algoritmo de subcadena, especifique la parte del campo que desea utilizar en la subcadena:
    1. En el campo Posición de inicio, especifique la posición en el campo en el que desea que comience la subcadena.
    2. En el campo Longitud, seleccione el número de caracteres desde la posición de inicio que desea incluir en la subcadena.

      Por ejemplo, supongamos que tenemos los siguientes datos en un campo llamado LastName:

      Augustine

      Si especifica 3 como la posición de inicio y 6 como la posición final, la subcadena sería:

      gustin

  5. Marque la casilla Eliminar el ruido de caracteres para eliminar todos los caracteres no numéricos ni alfanuméricos, como guiones, espacios en blanco y otros caracteres especiales del campo antes de aplicar el algoritmo.
  6. Para algoritmos de subcadena y consonantes, puede ordenar los datos en el campo antes de aplicar el algoritmo de control de la casilla Ordenar entrada. Después, puede optar por ordenar los caracteres o los términos en el campo en orden alfabético.
  7. Haga clic en Aceptar para guardar la configuración.
  8. Repita los pasos las veces que sea necesario si desea agregar algoritmos para producir una ID más compleja.
    Nota: La definición de clave única siempre se muestra en un color distinto y no se puede borrar.