Binning の概要

Binning ステージは、目標情報を考慮に入れずに、連続変数をグループ (ビン) に分類する、教師なしビニングとして知られる処理を実行します。取得されるデータには、レンジ、個数、各レンジ内の値の割合などがあります。

ビニングの実行には、次のような利点があります。
  • データが欠落しているレコードをモデルに含めることができる。
  • 外れ値がモデルに与える影響を制御または緩和することができる。
  • 最終モデルの係数の重みを同等にすることによって、特性によって尺度が異なる問題を解決する。

Spectrum™ Technology Platform の教師なしビニングでは、データを同じサイズのビンに分割する均等幅ビン、または、データをほぼ同数のレコードを含むグループに分割する均等個数ビンが使用できます。Binning ステージでは、均等幅ビンは、[Equal Ranges] ビン、均等個数ビンは、[Equal Count] ビンと呼ばれます。

コマンド ラインの命令を使用して、ビニングの一覧を表示したり、ビニングを削除したりできます。『管理ガイド』の「管理ユーティリティ」セクションの「Machine Learning モジュール」を参照してください。