Konfigurieren von Standardoptionen

  1. Lassen Sie Eingabefelder standardisieren aktiviert, um die numerischen Spalten zu standardisieren, damit diese keine Mittelwert- und Einheitenvarianz aufweisen.
    Wenn Sie keine Standardisierung verwenden, können die Ergebnisse Komponenten enthalten, die von Variablen dominiert werden, die statt richtiger Beiträge relativ zu anderen Attributen in der Skalierung eine größere Varianz zu haben scheinen.
  2. Aktivieren Sie Anzahl der Cluster schätzen, damit der Algorithmus „K-Means“ versucht, die Anzahl der in Ihrem Modell enthaltenen Cluster zu bestimmen. Auch wenn Sie die Anzahl der gewünschten Cluster auf der Registerkarte „Modelleigenschaften“ angeben, kann bei der Routine während der Verarbeitung festgestellt werden, das für die Daten eine andere Anzahl von Clustern geeigneter wäre.
  3. Geben Sie für den Prozentsatz für Trainingsdaten einen Wert zwischen 1 und 100 an, wenn die Eingabedaten zufällig in Stichproben für Trainings- und Testdaten aufgeteilt werden.
  4. Geben Sie den Wert 100 abzüglich der in Schritt 5 eingegebenen Menge als Prozentsatz für Testdaten ein.
  5. Geben Sie eine Ziffer als Ausgangswert für Stichprobe ein, um sicherzustellen, dass die Darstellung der Daten bei jeder Datenflussausführung gleich ist, wenn diese in Test- und Trainingsdaten aufgeteilt werden. Deaktivieren Sie dieses Feld, damit die Aufteilung bei jeder Datenflussausführung beliebig erfolgt.
  6. Klicken Sie auf OK, um das Modell und die Konfiguration zu speichern, oder fahren Sie mit der nächsten Registerkarte fort.