Módulo Data Normalization

El Módulo de normalización de datos examina los términos en un registro y determina si el término está en el formato preferido.

Componentes

El módulo Data Normalization consta de:

  • Advanced Transformer: en esta etapa se exploran y dividen las cadenas de datos en múltiples campos, y se colocan los datos extraídos y sin extraer en un campo ya existente o nuevo.
  • Open Parser: esta etapa analiza los datos de entrada de múltiples culturas de todo el mundo por medio de una gramática de análisis simple pero eficaz. Esta gramática permite definir una secuencia de expresiones que representan patrones de dominio para analizar los datos de entrada. Open Parser también recopila datos estadísticos y otorga calificaciones a los cruces de análisis para ayudar a determinar la efectividad de las gramáticas de análisis utilizadas.
  • Table Lookup: esta etapa evalúa un término y lo compara con un formato previamente validado de ese término. Si el término no está en el formato adecuado, es reemplazado por su versión estándar. Las funciones de Table Lookup incluyen el cambio de palabras completas a abreviaturas y viceversa, el cambio de apodos a nombres completos o la corrección de palabras mal escritas.
  • Transliterator: Transliterator convierte una cadena de caracteres entre el alfabeto latino y otros alfabetos.