Opciones de índice de búsqueda simple

Tabla 1. Opciones de Candidate Finder

Nombre de la opción

Descripción/Valores válidos

Tipo de buscador

Seleccione Índice de búsqueda.

Nombre

Seleccione el índice correspondiente que se creó con la etapa Índice Write to Search en las etapas implementadas de Advanced Matching en Enterprise Designer.

Starting record (Registro de inicio)

Ingrese el número de registro donde deben comenzar los resultados de la búsqueda. El valor predeterminado es 1.

Resultados máximos

Ingrese la cantidad máxima de respuestas que desea que arroje el índice de búsqueda. El valor predeterminado es 10.
Nota: Si la cantidad de resultados máximos es demasiado alta, procese los resultados en lotes mediante el campo Tamaño de lotes para la recuperación.

Recuperar tamaño de lote

Si el valor de Resultados máximos es demasiado alto, especifique el tamaño de lote que usará para procesar los resultados. Esto optimiza el procesamiento de cantidades altas de registros. El valor predeterminado es 10000.

El valor Recuperar tamaño de lote recomendado es menor que Resultados máximos y si Recuperar tamaño de lote es mayor que Resultados máximos, los registros se procesan en un solo lote.

Nota: Este campo solo se aplica a motores de búsqueda compatibles con clúster y no a motores de búsqueda de datos heredados.

Obtener recuento de cruces

Devuelve el número total de cruces realizados. Por ejemplo, si usa el valor predeterminado "10" para el campo Resultados máximos, solo se mostrarán 10 resultados. Sin embargo, si marca esta casilla, el campo de salida TotalMatchCount le indicará cuántos cruces se realizaron durante el procesamiento.

Tipo de búsqueda de índice Determina el tipo de búsqueda de índice que desea realizar. Seleccione Búsqueda simple.

Campos del índice

Seleccione los campos de índice que desea usar para comparación en la búsqueda simple.

Campo de entrada

Seleccione el campo de entrada que desea usar para comparación en la búsqueda simple.

Analizador de entrada

Especifique el analizador que se usará para la función Tokenize en la cadena de entrada. Puede tomar uno de los siguientes valores:

  • Standard: Ofrece formación de muestras basada en gramática que contiene un superconjunto de analizadores de Whitespace y Stop Word. Comprende la puntuación del español para separar las palabras, sabe qué palabras ignorar (a través de Stop Word Analyzer) y realiza búsquedas que técnicamente no distinguen entre mayúsculas y minúsculas, con comparaciones de minúsculas. Por ejemplo, la cadena de caracteres “Pitney Bowes Software” se devolvería como tres muestras: “Pitney”, “Bowes” y “Software”.
  • Whitespace: Separa las muestras con espacios en blanco. Es un subconjunto de Standard Analyzer en cuanto comprende los espacios entre palabras en español en textos basados en espacios y saltos de línea.
  • StopWord: quita los artículos, como “la”, “y” y “un/una” para reducir el tamaño del índice y aumentar el rendimiento.
  • Palabra clave: crea una sola muestra desde un flujo de datos. Por ejemplo, la cadena de caracteres “Pitney Bowes Software” se devolvería como una muestra: “Pitney Bowes Software”.
  • Ruso: admite índices de idioma ruso y servicios de avance de caracteres. También es compatible con diversas palabra no significativas y elimina artículos como "y", "yo" y "tú" para reducir el tamaño del índice y aumentar el rendimiento.
  • Alemán: admite índices de idioma alemán y servicios de avance de caracteres. También es compatible con diversas palabras no significativas y elimina artículos como "el", "y" y "un" para reducir el tamaño del índice y aumentar el rendimiento.
  • Danés: admite índices de idioma danés y servicios de avance de caracteres. También es compatible con diversas palabras no significativas y elimina artículos como "en", "y" y "un" para reducir el tamaño del índice y aumentar el rendimiento.
  • Holandés: admite índices de idioma holandés y servicios de avance de caracteres. También es compatible con diversas palabras no significativas y elimina artículos como "el", "y" y "un" para reducir el tamaño del índice y aumentar el rendimiento.
  • Finlandés: admite índices de idioma finlandés y servicios de avance de caracteres. También es compatible con diversas palabras no significativas y elimina artículos como "es", "y" y "de" para reducir el tamaño del índice y aumentar el rendimiento.
  • Francés: admite índices de idioma francés y servicios de avance de caracteres. También es compatible con diversas palabras no significativas y elimina artículos como "el", "y" y "un" para reducir el tamaño del índice y aumentar el rendimiento.
  • Húngaro: admite índices de idioma húngaro y servicios de avance de caracteres. También es compatible con diversas palabras no significativas y elimina artículos como "el", "y" y "un" para reducir el tamaño del índice y aumentar el rendimiento.
  • Italiano: admite índices de idioma italiano y servicios de avance de caracteres. También es compatible con diversas palabras no significativas y elimina artículos como "el", "y" y "un" para reducir el tamaño del índice y aumentar el rendimiento.
  • Noruego: admite índices de idioma noruego y servicios de avance de caracteres. También es compatible con diversas palabras no significativas y elimina artículos como "el", "y" y "un" para reducir el tamaño del índice y aumentar el rendimiento.
  • Portugués: admite índices de idioma portugués y servicios de avance de caracteres. También es compatible con diversas palabras no significativas y elimina artículos como "el", "y" y "un" para reducir el tamaño del índice y aumentar el rendimiento.
  • Español: admite índices de idioma español y servicios de avance de caracteres. También es compatible con diversas palabras no significativas y elimina artículos como "el", "y" y "un" para reducir el tamaño del índice y aumentar el rendimiento.
  • Sueco: admite índices de idioma sueco y servicios de avance de caracteres. También es compatible con diversas palabras no significativas y elimina artículos como "el", "y" y "un" para reducir el tamaño del índice y aumentar el rendimiento.
  • Hindi: admite índices de idioma hindi y servicios de avance de caracteres. También es compatible con diversas palabras no significativas y elimina artículos como "por", "y" y "un" para reducir el tamaño del índice y aumentar el rendimiento.

Pestaña Campos de salida

Marque la casilla Incluir para seleccionar los campos almacenados que se deben incluir en el resultado.
Nota: Si el campo de salida es de una etapa anterior en el flujo de datos y posee el mismo nombre que el del campo almacenado del índice de búsqueda, los valores del campo de entrada sobrescribirán los valores en el campo de salida.