Opciones

  1. En el campo Cargar regla de cruce seleccione una de las reglas de cruce predefinidas, que puede usar como está o bien puede modificarla para que se ajuste a sus necesidades. Si desea crear una nueva regla de cruce sin usar una de las reglas de cruce predefinidas como punto de partida, haga clic en Nueva. Solamente puede tener una regla personalizada en un flujo de datos.
    Nota: La función Opciones del flujo de datos en Enterprise Designer permite exponer la regla de cruce para la configuración durante la ejecución.
  2. Haga clic en Agrupar por para seleccionar el campo que quiere utilizar para agrupar registros en la cola de cruce. Intraflow Match solamente intenta establecer cruces entre registros de la misma cola de cruce.
  3. Seleccione la casilla Ordenar para ordenar sus datos de entrada antes del cruce en el campo seleccionado en el campo Agrupar por.
  4. Haga clic en Opciones avanzadas para especificar opciones de rendimiento de orden adicionales.
    Límite de registros en memoria
    Especifica la cantidad máxima de filas de datos que un ordenador guardará en la memoria antes de empezar la paginación al disco. De forma predeterminada, la ordenación de 10.000 registros o menos se realizará en la memoria y la de más de 10.000 registros se realizará como una ordenación en disco. El límite máximo es de 100.000 registros. Normalmente, la ordenación que se realiza en la memoria es más rápida que la que se realiza en disco; por lo tanto, este valor se debe establecer lo suficientemente alto para que la mayor parte de la ordenación sea en la memoria y solo los conjuntos de datos grandes se escriban en el disco.
    Nota: Tenga cuidado en entornos en los que se ejecuten trabajos de forma concurrente, porque aumentar la configuración del Límite de registros en memoria aumenta las posibilidades de agotar la memoria.
    Número máximo de archivos temporales
    Especifica el número máximo de archivos temporales que puede utilizar el proceso de orden. El uso de una gran cantidad de archivos temporales puede producir un mejor rendimiento. Sin embargo, la cantidad óptima depende en gran medida de la configuración en el servidor que ejecuta Spectrum™ Technology Platform. Debe experimentar distintas configuraciones y observar el efecto en el rendimiento de usar una mayor o menor cantidad de archivos temporales. Para calcular la cantidad aproximada de archivos temporales que se pueda necesitar , use la siguiente ecuación:
    (NumberOfRecords × 2) ÷ InMemoryRecordLimit = NumberOfTempFiles 
    Tenga en cuenta que la cantidad máxima de archivos temporales no puede ser superior a 1.000.
    Activar compresión
    Especifica que los archivos temporales se comprimen cuando se los escribe en el disco.
    Nota: La configuración del rendimiento óptimo de orden depende de la configuración del hardware de su servidor. No obstante, la siguiente ecuación generalmente produce un buen rendimiento de orden:
    (InMemoryRecordLimit × MaxNumberOfTempFiles ÷ 2) >= TotalNumberOfRecords
  5. Haga clic en Cruce inmediato en para realizar una comparación inicial de los valores de clave inmediata y determinar si se considerará que dos registros presentan un cruce.

    El cruce de clave inmediato puede ser una herramienta útil para reducir el número de comparaciones realizadas y, de ese modo, mejorar la velocidad de ejecución. Una clave inmediata imprecisa genera muchos falsos positivos en el cruce. Usted puede generar una clave inmediata como parte de la creación de una clave de cruce por medio de MatchKeyGenerator. Consulte Match Key Generator para obtener más información.

    Si dos registros presentan un cruce exacto en la clave inmediata, el candidato se considera un duplicado 100%. Si dos registros no presentan un cruce en el valor de clave inmediata, se los compara utilizando el método basado en reglas.

    Para determinar si un candidato presenta un cruce utilizando una clave inmediata, observe el valor del campo ExpressKeyIdentified que será Y si hay cruce y N si no. Cabe destacar que los registros sospechosos siempre tienen un valor de N en ExpressKeyIdentified.

  6. En el cuadro de texto Número de colección inicial especifique el número inicial que debe asignarse al campo de número de colección para los registros duplicados.

    El número de colección identifica cada registro duplicado en una cola de cruce. Los registros únicos reciben un número de colección de 0. Cada registro duplicado recibe un número de colección a partir del valor especificado en el cuadro de texto Número de colección inicial.

  7. Seleccione una de las siguientes opciones:
    OpciónDescripción

    Comparar el registro sospechoso con todos los candidatos

    Esta opción compara el registro sospechoso con todos los candidatos en el mismo grupo de cruce (agrupar según opción) aún cuando ya se haya encontrado un duplicado en el grupo de cruce. Por ejemplo:

    Sospechoso- John Smith
    Candidato - Bill Jones
    Candidato - John Smith
    Candidato - John Smith

    En el ejemplo, el registro sospechoso John Smith se comparará con ambos candidatos John Smith.

    Marque la casilla Devolver candidatos únicos para devolver los registros dentro de un grupo de cruce del puerto candidato que hayan sido identificados como registros únicos.

    Detener cruce de sospechosos con candidatos después de encontrar n duplicados

    Esta opción compara el registro sospechoso con todos los candidatos del mismo grupo de cruce (opción agrupar por), pero detiene el cruce cuando se identifica la cantidad de duplicados definida por el usuario. Por ejemplo, si decide detener la comparación de candidatos luego de encontrar un duplicado y cuenta con los siguientes datos:

    Sospechoso- John Smith
    Candidato - Bill Jones
    Candidato - John Smith
    Candidato - John Smith

    En el ejemplo, el registro sospechoso John Smith detendría la comparación dentro del grupo de cruce al identificarse como duplicado el primer candidato John Smith.

  8. Haga clic en Generar datos para análisis para generar resultados de cruce. Para obtener más información, consulte Análisis de resultados de cruce.
  9. Al asignar el número de colección 0 a los registros únicos, marcados de forma predeterminada, se asignarán ceros como números de colección a los registros únicos. Desmarque esta opción para generar números de colección distintos a cero para los registros únicos. Los números de colección de los registros únicos estarán en secuencia con cualquiera de los otros números de colección. Por ejemplo, si su flujo de datos de cruce encuentra cinco registros y los tres primeros registros son únicos, los números de colección se asignarán como se muestra en el primer grupo a continuación. Si su flujo de datos de cruce encuentra cinco registros y los dos últimos son únicos, los números de colección se asignarán como se muestra en el segundo grupo a continuación.
    OpciónDescripción
    Número de colección Tipo de registro
    1 Único
    2 Único
    3 Único
    4 Duplicado/sospechoso
    4 Duplicado/sospechoso
       
    Número de colección Tipo de registro
    1 Duplicado/sospechoso
    1 Duplicado/sospechoso
    2 Único
    3 Único
    4 Único
    Si deja marcada esta opción, a todos los registros únicos que se encuentren en su flujo de datos se les asignará predeterminadamente un número de colección de cero.
  10. Si crea una nueva regla de comparación personalizada, consulte Generación de reglas de cruce para obtener más información.
  11. Haga clic en Evaluar para evaluar qué calificación obtuvo el registro sospechoso en comparación con los registros candidatos. Para obtener más información, consulte Interflow Match.