Introducción a Binning

La etapa Binning realiza lo que se conoce como binning supervisado, que divide una variable continua en grupos (contenedores) sin considerar la información de objetivos. Los datos capturados incluyen rangos, cantidades y porcentaje de valores dentro de cada rango.

Las ventajas de ejecutar binning incluyen:
  • Permite incluir registros con datos faltantes en el modelo.
  • Controla o mitiga el impacto de valores atípicos en el modelo.
  • Soluciona el problema de tener escalas diferentes entre las características, permitiendo que las ponderaciones de los coeficientes en el modelo final se puedan comparar.

En binning no supervisado de Spectrum™ Technology Platform, puede usar contenedores del mismo ancho, donde los datos se dividen en contenedores de igual tamaño, o contenedores de la misma frecuencia, donde los datos se dividen en grupos que contienen aproximadamente el mismo número de registros. En la etapa Binning, los contenedores que tienen el mismo ancho se denominan contenedores de Rango igual y los contenedores que tienen la misma frecuencia se denominan contenedores de Completación igual.