Opciones

La siguiente tabla enumera las opciones en la etapa Filter.

Nombre de la opción

Descripción / Valores válidos

Agrupar por

Especifica el campo que se usará para crear grupos de registros para filtrar. La etapa Filter conservará uno o más registros de cada grupo, dependiendo de la configuración de la etapa. En los casos donde haya usado una etapa de comparación tempranamente en el flujo de datos, como por ejemplo, Interflow Match, Intraflow Match o Transactional Match, debe seleccionar el campo CollectionNumber para usar las colecciones creadas por la etapa de comparación como los grupos. Sin embargo, si desea agrupar los recursos por otros campos, elija el campo aquí. Por ejemplo, si desea filtrar todos los registros que tengan el mismo valor en el campo AccountNumber, excepto uno, tendrá que seleccionar AccountNumber.

Ordenar

Si especifica un campo en el campo Agrupar por, marque esta casilla para ordenar los registros por valor en el campo que escoja. Esta opción está habilitada de forma predeterminada.

Avanzada

Haga clic en este botón para especificar las opciones de rendimiento de orden. De manera predeterminada, las opciones de rendimiento de orden que se especifican en Management Console, que son las opciones de rendimiento predeterminadas para su sistema, están activas. Si desea reemplazar las opciones de rendimiento predeterminadas del sistema, marque la casilla Invalidar opciones de rendimiento de orden y luego especifique en estos campos los valores que desea:

Límite de registros en memoria
Especifica la cantidad máxima de filas de datos que un ordenador guardará en la memoria antes de empezar la paginación al disco. De forma predeterminada, la ordenación de 10.000 registros o menos se realizará en la memoria y la de más de 10.000 registros se realizará como una ordenación en disco. El límite máximo es de 100.000 registros. Normalmente, la ordenación que se realiza en la memoria es más rápida que la que se realiza en disco; por lo tanto, este valor se debe establecer lo suficientemente alto para que la mayor parte de la ordenación sea en la memoria y solo los conjuntos de datos grandes se escriban en el disco.
Nota: Tenga cuidado en entornos en los que se ejecuten trabajos de forma concurrente, porque aumentar la configuración del Límite de registros en memoria aumenta las posibilidades de agotar la memoria.
Número máximo de archivos temporales
Especifica el número máximo de archivos temporales que puede utilizar el proceso de orden. El uso de una gran cantidad de archivos temporales puede producir un mejor rendimiento. Sin embargo, la cantidad óptima depende en gran medida de la configuración en el servidor que ejecuta Spectrum™ Technology Platform. Debe experimentar distintas configuraciones y observar el efecto en el rendimiento de usar una mayor o menor cantidad de archivos temporales. Para calcular la cantidad aproximada de archivos temporales que se pueda necesitar , use la siguiente ecuación:
(NumberOfRecords × 2) ÷ InMemoryRecordLimit = NumberOfTempFiles 
Tenga en cuenta que la cantidad máxima de archivos temporales no puede ser superior a 1.000.
Activar compresión
Especifica que los archivos temporales se comprimen cuando se los escribe en el disco.
Nota: La configuración del rendimiento óptimo de orden depende de la configuración del hardware de su servidor. No obstante, la siguiente ecuación generalmente produce un buen rendimiento de orden:
(InMemoryRecordLimit × MaxNumberOfTempFiles ÷ 2) >= TotalNumberOfRecords

Limitar la cantidad de registros duplicados obtenidos

Especifica la cantidad máxima de registros que se devuelven de cada grupo. Si la opción está establecida en 1, se pueden definir reglas de filtrado para determinar qué registro de cada grupo se debe devolver. Si no se define regla alguna, el primer registro de cada colección se devuelve y los demás se descartan. En este modo, las reglas de filtrado definen los registros que se conservarán.

Por ejemplo, si se define una regla en la cual se conserva el registro con el puntaje más alto de coincidencia de un grupo y la opción está establecida en 1, el registro con el puntaje más alto de coincidencia de cada grupo sobrevivirá y los demás registros del grupo se descartarán

Si la opción está establecida en un valor superior a uno, no se puede especificar reglas de filtrado.

Nota: En caso de que ningún registro de la colección cumpla con los criterios definidos, no se devuelve ningún registro del grupo.

Eliminar duplicados de la colección

Especifica que se deben utilizar reglas de filtrado para determinar los registros se eliminarán de la colección. Los registros restantes de la colección se conservarán. Al seleccionar esta opción, debe definir una regla.

Nota: Si el grupo contiene solo un registro, las reglas de filtrado se ignoran y el registro se conserva.

Opciones de regla

Las reglas de filtrado determinan los registros de un grupo que se conservarán o eliminarán. Si selecciona la opción Limitar la cantidad de registros duplicados, las reglas determinan qué registros sobreviven el filtro. Si selecciona la opción Eliminar los duplicados de colección, las reglas determinan qué registros se eliminan del flujo de datos.

Para agregar una regla, seleccione Reglas en la jerarquía de reglas y haga clic en Agregar regla

Si especifica varias reglas, deberá seleccionar un operador lógico para usar entre cada regla. Seleccione Y si desea que pase tanto la regla nueva como la regla anterior, para que se cumpla la condición. Seleccione O si desea que pase la regla anterior o la regla siguiente, para que se cumpla la condición.

Nota: Solo puede existir una condición en una etapa Filter. Cuando selecciona Condición en la jerarquía de reglas, los botones aparecen atenuados.
Opción Descripción

Nombre de campo

Especifica el nombre del campo de flujo de datos cuyo valor desea evaluar, para determinar si se va a filtrar el registro.

Tipo de campo

Especifica el tipo de datos del campo. Una de las siguientes:

No numérico
Seleccione esta opción si el campo contiene datos no numéricos (por ejemplo, datos de cadena).
Numérico
Seleccione esta opción si el campo contiene datos numéricos (por ejemplo, doble, flotante, entre otros).

Operador

Especifica el tipo de comparación que desea utilizar en la evaluación del campo. Una de las siguientes:

Contiene
Determina si el campo contiene el valor especificado. Por ejemplo, "sailboat" contiene el valor "boat".
IGUAL
Determina si el campo contiene el valor exacto especificado.
Mayor que
Determina si el valor de campo es mayor que el valor especificado. Esta operación solamente funciona con campos numéricos.
Mayor o igual que
Determina si el valor de campo es mayor o igual que el valor especificado. Esta operación solamente funciona con campos numéricos.
El más alto
Compara el valor del campo en todo el grupo de registros y determina qué registro tiene el valor más alto en el campo. Por ejemplo, si los campos del grupo contienen valores de 10, 20, 30 y 100, quedaría seleccionado el registro con el valor 100. Esta operación solamente funciona con campos numéricos. Si hay múltiples registros que poseen el valor más largo, se selecciona uno de ellos.
Está vacío
Determina si el campo no contiene ningún valor.
No está vacío
Determina si el campo contiene algún valor.
Menor que
Determina si el valor de campo es menor que el valor especificado. Esta operación solamente funciona con campos numéricos.
Menor o igual que
Determina si el valor de campo es menor o igual que el valor especificado. Esta operación solamente funciona con campos numéricos.
El más largo
Compara el valor del campo en todo el grupo de registros y determina qué registro tiene el valor más largo (en bytes) en el campo. Por ejemplo, si el grupo contiene los valores "Mike" y "Michael", quedaría seleccionado el registro con el valor "Michael". Si hay múltiples registros que poseen el valor más largo, se selecciona uno de ellos.
El más bajo
Compara el valor del campo en todo el grupo de registros y determina qué registro tiene el valor más bajo en el campo. Por ejemplo, si los campos del grupo contienen valores de 10, 20, 30 y 100, quedaría seleccionado el registro con el valor 10. Esta operación solamente funciona con campos numéricos. Si hay múltiples registros que poseen el valor más largo, se selecciona uno de ellos.
Más común
Determina si el valor de campo contiene el valor que aparece más frecuentemente en este campo entre los registros del grupo. Si hay dos o más valores que son los más comunes, no se realiza acción alguna.
Diferente
Determina si el valor de campo no es el mismo que el valor especificado.

Tipo de valor

Especifica el tipo de valor que desea comparar al valor del campo. Una de las siguientes:

Nota: Esta opción no está disponible si selecciona el operador El más alto, El más bajo, o El más largo.
Campo
Seleccione esta opción si desea comparar con este campo el valor del campo de otro flujo de datos.
Cadena
Seleccione esta opción si desea comparar el campo con un valor específico.
Valor

Especifica el valor que se va a comparar con el valor del campo. Si seleccionó Campo en el campo Tipo de campo seleccione un campo de flujo de datos. Si seleccionó Cadena en el campo de Tipo de valor, ingrese el valor que desea usar para la comparación.

Nota: Esta opción no está disponible si selecciona el operador El más alto, El más bajo, o El más largo.

Ejemplo de una regla de filtrado

Esta regla conserva el registro de cada grupo que posee el mayor valor en el campo MatchScore. Cabe destacar que las opciones Valor y Tipo de valor no se aplican cuando el operador es el más alto o el más bajo.

Nombre del campo = MatchScore
Tipo de campo = Numérico
Operador = Mayor

Esta regla conserva el registro en los que el valor en AccountNumber es "12345".

Nombre del campo = AccountNumber
Tipo de campo = Numérico
Operador = Igual
Tipo de valor = Cadena
Valor = 12345