Creación de un registro Best of Breed.

Para eliminar de sus datos registros duplicados, puede decidir combinar dichos datos a partir de grupos de registros duplicados en un único registro "best of breed". Esta metodología es conveniente cuando cada registro duplicado contiene datos del mismo tipo (por ejemplo, números telefónicos o nombres) y desea conservar los mejores datos de cada registro en el registro sobreviviente.

Este procedimiento describe la forma de crear un flujo de datos que combine registros duplicados en un registro best of breed.

  1. En Enterprise Designer, cree un flujo de datos que identifique los registros duplicados mediante comparación.

    El cruce es el primer paso en la desduplicación, ya que se necesita identificar registros que son similares, como por ejemplo registros que tienen el mismo número de cuenta o nombre. Consulte las siguientes secciones para obtener instrucciones acerca de la creación de flujo de datos que realicen cruce de registros.

    Nota: Solo necesita generar el flujo de datos en el punto donde lee datos y realiza el cruce con una etapa Interflow Match, Intraflow Match o Transactional Match. Cuando haya creado el flujo de datos hasta este punto, siga adelante con los pasos siguientes.
  2. Cuando haya definido un flujo de datos que lee datos y cruza registros, arrastre hacia el lienzo una etapa Best of Breed y conéctela a la etapa que realiza el cruce (Interflow Match, Intraflow Match o Transactional Match).

    Por ejemplo, si su flujo de datos lee datos de un archivo y realiza un cruce con Intraflow Match, su flujo de datos tendrá el siguiente aspecto luego de añadir una etapa Best of Breed:

  3. Haga doble clic en el lienzo en la etapa Best of Breed.
  4. En el campo Agrupar por, seleccione CollectionNumber.
  5. En Configuración de Best of Breed, seleccione Reglas en el árbol de condiciones.
  6. Haga clic en Agregar regla.

    Los registros de cada grupo son evaluados para ver si cumplen con las reglas que defina aquí. Si un registro coincide con una regla, sus datos pueden copiarse en el registro best of breed, dependiendo de cómo se hayan configurado las acciones asociadas a la regla. Definirá las acciones más adelante.

  7. Defina una regla que un registro duplicado deba cumplir a fin de que sus datos sean copiados en el registro best of breed.

    Use las siguientes opciones para definir una regla:

    OpciónDescripción

    Nombre de campo

    Especifica el nombre del campo de flujo de datos cuyo valor usted desea determinar en caso de que se cumpla la condición y se deban realizar las siguientes acciones.

    Tipo de campo

    Especifica el tipo de datos del campo. Una de las siguientes:

    No numérico
    Seleccione esta opción si el campo contiene datos no numéricos (por ejemplo, datos de cadena).
    Numérico
    Seleccione esta opción si el campo contiene datos numéricos (por ejemplo, doble, flotante, entre otros).

    Operador

    Especifica el tipo de comparación que desea utilizar en la evaluación del campo. Una de las siguientes:

    Contiene
    Determina si el campo contiene el valor especificado. Por ejemplo, "sailboat" contiene el valor "boat".
    IGUAL
    Determina si el campo contiene el valor exacto especificado.
    Mayor que
    Determina si el valor de campo es mayor que el valor especificado. Esta operación solamente funciona con campos numéricos.
    Mayor o igual que
    Determina si el valor de campo es mayor o igual que el valor especificado. Esta operación solamente funciona con campos numéricos.
    El más alto
    Compara el valor del campo en todo el grupo de registros y determina qué registro tiene el valor más alto en el campo. Por ejemplo, si los campos del grupo contienen valores de 10, 20, 30 y 100, quedaría seleccionado el registro con el valor 100. Esta operación solamente funciona con campos numéricos. Si hay múltiples registros que poseen el valor más largo, se selecciona uno de ellos.
    Está vacío
    Determina si el campo no contiene ningún valor.
    No está vacío
    Determina si el campo contiene algún valor.
    Menor que
    Determina si el valor de campo es menor que el valor especificado. Esta operación solamente funciona con campos numéricos.
    Menor o igual que
    Determina si el valor de campo es menor o igual que el valor especificado. Esta operación solamente funciona con campos numéricos.
    El más largo
    Compara el valor del campo en todo el grupo de registros y determina qué registro tiene el valor más largo (en bytes) en el campo. Por ejemplo, si el grupo contiene los valores "Mike" y "Michael", quedaría seleccionado el registro con el valor "Michael". Si hay múltiples registros que poseen el valor más largo, se selecciona uno de ellos.
    El más bajo
    Compara el valor del campo en todo el grupo de registros y determina qué registro tiene el valor más bajo en el campo. Por ejemplo, si los campos del grupo contienen valores de 10, 20, 30 y 100, quedaría seleccionado el registro con el valor 10. Esta operación solamente funciona con campos numéricos. Si hay múltiples registros que poseen el valor más largo, se selecciona uno de ellos.
    Más común
    Determina si el valor de campo contiene el valor que aparece más frecuentemente en este campo entre los registros del grupo. Si hay dos o más valores que son los más comunes, no se realiza acción alguna.
    Diferente
    Determina si el valor de campo no es el mismo que el valor especificado.

    Tipo de valor

    Especifica el tipo de valor que desea comparar al valor del campo. Una de las siguientes:

    Nota: Esta opción no está disponible si selecciona el operador El más alto, El más bajo, o El más largo.
    Campo
    Seleccione esta opción si desea comparar con este campo el valor del campo de otro flujo de datos.
    Cadena
    Seleccione esta opción si desea comparar el campo con un valor específico.
    Valor

    Especifica el valor que se va a comparar con el valor del campo. Si seleccionó Campo en el campo Tipo de campo seleccione un campo de flujo de datos. Si seleccionó Cadena en el campo de Tipo de valor, ingrese el valor que desea usar para la comparación.

    Nota: Esta opción no está disponible si selecciona el operador El más alto, El más bajo, o El más largo.
  8. Haga clic en Aceptar.
  9. Haga clic en el nodo Acciones en el árbol.
  10. Haga clic en Agregar acción.
  11. Especifique los datos que se copiarán en el registro best of breed si es que dicho registro cumple con los criterios definidos en la regla.
    OpciónDescripción

    Tipo de origen

    Especifica el tipo de datos que se copiará en el registro Best of breed.Las opciones son:

    Campo
    Seleccione esta opción si desea copiar un valor de un campo en el registro Best of breed.
    String
    Seleccione esta opción si desea copiar un valor constante en el registro Best of breed.

    Datos de origen

    Especifica los datos que se copiarán en el registro Best of breed.Si el tipo de origen es Campo, seleccione el campo cuyos valores desea copiar en el campo de destino.Si el tipo de origen es Cadena, especifique un valor constante para copiar en el campo de destino.

    Destino

    Especifica el destino en el registro Best of breed al cual desea copiar los datos especificados en el campo Datos de origen.

    Acumular datos de origen

    Si los datos en el campo Datos de origen son datos numéricos, puede habilitar esta opción para combinar los datos de origen en todos los registros duplicados y colocar el valor total en el registro Best of breed.

    Por ejemplo, si hubiese tres registros duplicados en el grupo, y estos contuviesen estos valores en el campo de Depósitos:

    100.00
    20.00
    5.00

    Estos tres valores serían combinados y el valor total, de 125,00, se colocaría en el campo Depósitos del registro Best of breed.

  12. Haga clic en Aceptar.

    Ahora ha configurado Best of Breed con una regla y una acción. Puede añadir reglas y acciones adicionales en caso necesario.

  13. Haga clic en Aceptar para cerrar la ventana de Opciones de Best of Breed.
  14. Arrastre hacia el lienzo una etapa receptora y conéctela a la etapa Best of Breed.

    Por ejemplo, si estuviese utilizando la etapa receptora Write to File, su flujo de datos tendría el siguiente aspecto:

  15. Haga doble clic en la etapa receptora y configúrela.

    Para obtener información acerca de cómo configurar etapas receptoras, consulte la Guía de Dataflow Designer.

Ahora tiene un flujo de datos que identifica registros coincidentes y combina los registros dentro de una colección en un único registro best of breed.