Konfigurieren von Standardoptionen

  1. Lassen Sie Eingabefelder standardisieren aktiviert, um die numerischen Spalten zu standardisieren, damit diese keine Mittelwert- und Einheitenvarianz aufweisen.
    Wenn Sie keine Standardisierung verwenden, können die Ergebnisse Komponenten enthalten, die von Variablen dominiert werden, die statt richtiger Beiträge relativ zu anderen Attributen in der Skalierung eine größere Varianz zu haben scheinen.
  2. Aktivieren Sie Eingabedaten bewerten, um eine Spalte für die Modellvorhersage (Punktzahl) für Eingabedaten hinzuzufügen.
  3. Aktivieren Sie Vorherig, wenn die Daten erfasst wurden und die Bedeutung der Antwort nicht die Realität widerspiegelt. Geben Sie anschließend die vorherige Wahrscheinlichkeit für p(y==1) in das Textfeld ein.
  4. Geben Sie an, wie mit fehlenden Daten umgegangen werden soll, indem Sie Überspringen aktivieren oder Mittelwerte zuschreiben, wodurch der Mittelwert für fehlende Daten hinzugefügt wird.
  5. Geben Sie für den Prozentsatz für Trainingsdaten einen Wert zwischen 1 und 100 an, wenn die Eingabedaten zufällig in Stichproben für Trainings- und Testdaten aufgeteilt werden.
  6. Geben Sie den Wert 100 abzüglich der in Schritt 5 eingegebenen Menge als Prozentsatz für Testdaten ein.
  7. Geben Sie eine Ziffer als Ausgangswert für Stichprobe ein, um sicherzustellen, dass die Darstellung der Daten bei jeder Datenflussausführung gleich ist, wenn diese in Test- und Trainingsdaten aufgeteilt werden. Deaktivieren Sie dieses Feld, damit die Aufteilung bei jeder Datenflussausführung beliebig erfolgt.
  8. Klicken Sie auf OK, um das Modell und die Konfiguration zu speichern, oder fahren Sie mit der nächsten Registerkarte fort.