Detección de posibles clientes que ya son clientes

Esta plantilla de flujo de datos muestra cómo comparar los datos de posibles clientes en un archivo de entrada con los datos de clientes en una base de datos de clientes para determinar si un posible cliente ya es cliente. Se trata de un flujo de datos de servicios, lo que quiere decir que se puede tener acceso al flujo de datos por medio de API o de servicios web.

Situación empresarial posible

Como ejecutivo de cuenta de una empresa de ventas por Internet, quiere determinar si un posible cliente ya ha comprado o si es un cliente nuevo.

El siguiente servicio de flujo de datos ofrece una solución a la posible situación empresarial:



Esta plantilla de flujo de datos está disponible en Enterprise Designer. Vaya a Archivo > Nuevo > Flujo de datos > Desde plantilla y seleccione servicios Este flujo de datos requiere de los módulos Advanced Matching Module y Universal Name Module.

Para cada registro en el archivo de entrada, este flujo de datos realiza lo siguiente:

Input

Los campos de entrada seleccionados para esta plantilla son AddressLine1, City, Name, PostalCode y StateProvince. AddressLine1 y Name son los campos clave para el procesamiento del flujo de datos de esta plantilla.

Name Parser

En esta plantilla, la etapa Name Parser (Analizador de nombre) se denomina Parse Personal Name (Análisis de nombres personales). La etapa Parse Personal Name examina los campos de nombre y los compara con los datos almacenados en los archivos de bases de datos de nombres de Spectrum™ Technology Platform. Según la comparación, divide los datos de nombre en los campos de nombre, segundo nombre y apellido, y asigna un tipo de entidad y un género a cada nombre. También utiliza el reconocimiento de patrones además de los datos de nombre.

En esta plantilla, la etapa Parse Personal Name se configura de la siguiente manera.

  • Se selecciona la opción Analizar nombres personales y se desmarca la opción Analizar nombres de empresas. Cuando seleccionan estas opciones, los nombres de pila se evalúan en cuanto a género, orden, puntuación y no se realiza una evaluación de nombres de empresas.
  • El Origen de determinación de género está configurado de manera predeterminada. En la mayoría de los casos, la configuración predeterminada es la mejor opción para determinar el género porque cubre una amplia variedad de nombres. De todas maneras, si está procesando nombres de una cultura específica, seleccione esa cultura. La selección de una cultura específica contribuye a garantizar la asignación del género correcto a los nombres. Por ejemplo, si se deja la opción predeterminada seleccionada, el nombre Jean será identificado como un nombre femenino. Sin embargo, si selecciona francés, será identificado como un nombre masculino.
  • El orden configurado es el natural. Los campos de nombre están ordenados por tratamiento, nombre, segundo nombre, apellido y sufijo.
  • La opción Retener puntos está desmarcada. No se mantiene ninguna puntuación en los datos de nombres.

Candidate Finder

La etapa Candidate Finder (Localizador de candidatos) se utiliza en combinación con la etapa Transactional Match (Cruce transaccional).

La etapa Candidate Finder obtiene los registros candidatos que conformarán los posibles cruces que serán evaluados por la etapa Transactional Match. Además, según el formato de sus datos, es posible que Candidate Finder también necesite analizar el nombre o la dirección del registro sospechoso, los registros candidatos, o ambos.

Durante la configuración de Candidate Finder, se selecciona la conexión de base de datos mediante la cual se ejecutará la consulta especificada. Es posible seleccionar cualquier conexión configurada en Management Console. Para establecer una conexión con una base de datos que no está en la lista, configure una conexión a esa base de datos en Management Console y, luego, cierre y vuelva a abrir Candidate Finder para actualizar la lista de conexiones.

Para definir la consulta SQL, puede ingresar cualquier instrucción SQL Select válida en el cuadro de texto de la vista Opciones de Candidate Finder. Por ejemplo, suponga que, en su base de datos, tiene una tabla denominada Customer_Table que tiene las siguientes columnas:

Customer_Table

Cust_Name

Cust_Address

Cust_City

Cust_State

Cust_Zip

Nota: Puede ingresar cualquier instrucción SQL Select válida, pero la opción Select * no es válida en este control.

Para recuperar todas las filas de la base de datos, puede construir una consulta similar a la siguiente:

select Cust_Name, Cust_Address, Cust_City, Cust_State, Cust_Zip from Customer_Table; 

Sin embargo, es poco probable que quiera cruzar su transacción con todas las filas de la base de datos. Para obtener solo los registros candidatos relevantes, es recomendable agregar una cláusula WHERE utilizando la sustitución de variable. La sustitución de variable es una notación especial que se utiliza para que el motor de selección de candidatos reemplace la variable con los datos reales de su registro sospechoso.

Para utilizar la sustitución de variable, encierre el nombre del campo entre llaves y coloque adelante un signo de dólar ${FieldName}. Por ejemplo, la siguiente consulta arrojará solo aquellos registros con un valor en Cust_Zip que coincida con el valor en PostalCode del registro sospechoso.

select Cust_Name, Cust_Address, Cust_City, Cust_State,Cust_Zip 
from Customer_Table 
where Cust_Zip = ${PostalCode}; 

Luego, debe asignar las columnas de la base de datos a los campos de la etapa si los nombres de las columnas de su base de datos no coinciden de manera exacta con los nombres de los campos del componente. Si los nombres coinciden, se asignarán automáticamente a los campos correspondientes de la etapa. Es necesario asignar los campos seleccionados (columnas de la base de datos) a los campos de la etapa (nombres de campos definidos en el flujo de datos).

Considere nuevamente la tabla Customer_Table del ejemplo anterior:

Customer_Table

Cust_Name

Cust_Address

Cust_City

Cust_State

Cust_Zip

Cuando se recuperan estos registros de la base de datos, es necesario asignar los nombres de las columnas a los nombres de los campos que serán utilizados por Transactional Match y otras etapas de su flujo de datos. Por ejemplo, Cust_Address podría asignarse a AddressLine1 y Cust_Zip se asignaría a PostalCode.

  1. Seleccione la lista desplegable de Campos seleccionados en la vista Opciones de Candidate Finder. Luego, seleccione la columna Cust_Zip de la base de datos.
  2. Seleccione la lista desplegable en Campos de la etapa. Luego, seleccione el campo al que desea asignarle la columna.

Por ejemplo, si desea asignar Cust_Zip a PostalCode, primero seleccione Cust_Zip en Campos seleccionados y luego seleccione PostalCode en la fila correspondiente del Campo de la etapa.

Otra alternativa para asignar campos (además de la que se describió anteriormente) es utilizar una notación especial en su consulta SQL. Para realizar la asignación, ingrese el nombre del campo de la etapa, encerrado entre llaves, después del nombre de la columna en su consulta. Al hacerlo, los campos seleccionados se asignarán automáticamente a los campos correspondientes de la etapa.

A continuación, se muestra un ejemplo utilizando la consulta mencionada anteriormente:

select Cust_Name {Name}, Cust_Address {AddressLine1}, 
 Cust_City {City}, Cust_State {StateProvince}, 
 Cust_Zip {PostalCode} 
from Customer 
where Cust_Zip = ${PostalCode}; 

Transactional Match

La etapa Transactional Match se utiliza en combinación con la etapa Candidate Finder.

La etapa Transactional Match le permite comparar los registros sospechosos con posibles registros candidatos que se obtienen en la etapa Candidate Finder.

Transactional Match utiliza reglas de cruce para comparar el registro sospechoso con todos los registros candidatos que tienen el mismo número de grupo de candidatos (asignado en Candidate Finder) a fin de identificar duplicados. Si el registro candidato es un duplicado, se le asigna un número de colección, el tipo de registro de cruce se etiqueta como duplicado y luego se copia. A los candidatos sin coincidencias en el grupo se les asigna el número de colección 0, se etiquetan como únicos y luego también se copian.

En esta plantilla, se crea una regla de cruce personalizada que compara LastName y AddressLine1.

Estas son algunas pautas por seguir durante la creación de una jerarquía de comparación:

  • Los nodos principales deben tener un nombre único. No pueden ser campos.
  • El campo secundario debe ser un campo de tipo de dato de Spectrum™ Technology Platform, es decir, un tipo de dato disponible a través de una o más etapas.
  • Todos los nodos secundarios de un nodo principal deben usar los mismos operadores lógicos. Para combinar conectores, primero deben crearse nodos principales intermedios.
  • Los umbrales del nodo principal pueden ser más altos que los umbrales de los nodos secundarios.
  • No es necesario que los nodos principales tengan umbral.

Salida

Como servicio, esta plantilla envía todos los campos disponibles a la salida. Es posible limitar la salida según sus necesidades.