Einführung in das Binning

Der „Binning“-Schritt führt das so genannte unbeaufsichtigte Binning durch, bei dem eine kontinuierliche Variable in Gruppen (Bins) unterteilt wird. Dabei werden keine objektiven Informationen berücksichtigt. Die erfassten Daten beinhalten Bereiche, Mengen und Prozentsätze von Werten der einzelnen Bereiche.

Zu den Vorteilen bei der Durchführung des Binnings zählen folgende:
  • Es lässt zu, dass Datensätze mit fehlenden Daten in das Modell eingeschlossen werden.
  • Es steuert bzw. verringert die Auswirkungen von Ausreißern innerhalb des Modells.
  • Es löst das Problem, dass die Merkmale verschiedene Skalierungen aufweisen. Dadurch können die Gewichtungen der Koeffizienten im Endmodell miteinander verglichen werden.

Sie können beim unbeaufsichtigten Binning der Spectrum™ Technology Platform Bins vom Typ „equal-width“ verwenden, bei denen die Daten in gleich große Bins unterteilt werden, oder in Bins vom Typ „equal-frequency“, bei denen die Daten in Gruppen aufgeteilt werden, die in etwa die gleiche Anzahl von Datensätzen enthalten. Im „Binning“-Schritt werden Bins vom Typ „equal-width“ als „Equal Range“-Bins und Bins vom Typ „equal-frequency“ als „Equal Population“-Bins bevorzugt.

Sie können weitere Binning-Funktionen mit dem Tool Binning Management der Machine Learning-Modellverwaltung durchführen.

Mithilfe von Befehlszeilenanweisungen können Sie eine Binning-Liste anzeigen und Binnings löschen. Weitere Informationen erhalten Sie unter „Machine Learning-Modul“ im Abschnitt Administrationsumgebung des Administratorhandbuchs.
Anmerkung: Wenn Sie Spectrum™ Technology Platform von Version 12.0 SP1 auf 12.0 SP2 aktualisieren, müssen Sie für alle aktualisierten Binning-Instanzen im Tool „Binning Management“ der Machine Learning-Modellverwaltung die Verfügbarkeit aufheben, bevor Sie sie in 12.0 SP2 für das Rebinning verwenden. Dieser Schritt ist nicht erforderlich, wenn Sie in Binning Lookup aktualisierte Binnings anstelle von traditionellen Binnings verwenden.