Introduction à Binning

Le stage Binning réalise ce qui est dit un binning sans supervision, qui divise une variable continue en groupes (bins) sans prendre en compte les informations d'objectif. Les données capturées incluent des plages, des quantités et un pourcentage des valeurs de chaque plage.

Lorsque vous exécutez un binning, les avantages sont les suivants :
  • Cela permet d'inclure des enregistrements avec des données manquantes dans le modèle.
  • Cela contrôle ou atténue l’impact des observations aberrantes sur le modèle.
  • Cela résout le problème d’avoir différentes échelles parmi les caractéristiques, permettant ainsi de comparer les poids des coefficients du modèle final.

Dans le binning sans supervision Spectrum™ Technology Platform, vous pouvez utiliser des bins de largeur égale, dans lesquels les données sont divisées en bins de taille identique, ou des bins de fréquence égale, dans lesquels les données sont divisées en groupes contenant à peu près le même nombre d’enregistrements. Dans le stage Binning, les bins de largeur égale sont appelés bins de plage égale et les bins de fréquence égale sont appelés bins de population égale.

Vous pouvez afficher une liste de binnings et supprimer des binnings à l'aide des instructions de la ligne de commande. Reportez-vous au « Module Machine Learning » de la section Utilitaire Administration du Guide d’administration.