Konfigurieren erweiterter Optionen

  1. Lassen Sie Konstante Felder ignorieren aktiviert, damit Felder übersprungen werden, die für die einzelnen Datensätze die gleichen Werte enthalten.
  2. Aktivieren Sie p-Werte berechnen, um p-Werte für die Parameterschätzungen zu berechnen.
  3. Aktivieren Sie Kollineare Spalte entfernen, damit kollineare Spalten während der Modellerstellung automatisch entfernt werden. Dies führt zu einem Koeffizienten von 0 im zurückgegebenen Modell.
    Diese Option muss aktiviert werden, wenn p-Werte berechnen ebenfalls aktiviert ist.
  4. Lassen Sie Konstanten Begriff einschließen (abfangen) aktiviert, um einen konstanten Begriff im Modell einzuschließen (abzufangen).
    Dieses Feld muss aktiviert werden, wenn Kollineare Spalte entfernen ebenfalls aktiviert ist.
  5. Wählen Sie einen Solver aus der Dropdown-Liste aus. Beachten Sie, dass „CoordinateDescent“ und „CoordinateDescentNaive“ derzeit experimentell sind.
    Auto
    Solver wird basierend auf Eingabedaten und Parametern bestimmt.
    CoordinateDescent
    IRLSM mit der Version der Kovarianzaktualisierungen der zyklischen Koordinate, die aus der innersten Schleife stammt.
    CoordinateDescentNaive
    IRLSM mit der Version der naiven Aktualisierungen der zyklischen Koordinate, die aus der innersten Schleife stammt.
    IRLSM
    Ideal für Probleme mit einer geringen Anzahl von Prädiktoren oder Lambda-Suchvorgänge mit L1-Penalty.
    LBFGS
    Ideal für Datasets mit vielen Spalten.
  6. Lassen Sie Seed für N-fach aktiviert, und geben Sie einen numerischen Ausgangswert ein, um sicherzustellen, dass die Darstellung der Daten bei jeder Datenflussausführung gleich ist, wenn diese in Test- und Trainingsdaten aufgeteilt werden. Deaktivieren Sie dieses Feld, damit die Aufteilung bei jeder Datenflussausführung beliebig erfolgt.
  7. Aktivieren Sie N-fach und geben Sie die Anzahl der Folds ein, wenn Sie eine Kreuzvalidierung durchführen.
  8. Klicken Sie auf Foldzuweisung, und wählen Sie aus der Dropdown-Liste aus, ob Sie eine Kreuzvalidierung durchführen. Dieses Feld ist nur anwendbar, wenn Sie unter N-fach einen Wert eingegeben haben und Foldfeld nicht angegeben ist.
    Auto

    Lässt zu, dass der Algorithmus automatisch eine Option auswählt; derzeit wird „Random“ verwendet.

    Modulo

    Teilt das Dataset gleichmäßig auf die Folds auf und ist nicht vom Ausgangswert abhängig.

    Random

    Teilt die Daten zufällig in „N-fach“-Bestandteile ein; diese Einstellung ist für umfangreiche Datasets am besten geeignet.

  9. Wenn Sie eine Kreuzvalidierung durchführen, aktivieren Sie Foldfeld und wählen Sie aus der Dropdown-Liste das Feld aus, das die Foldindexzuweisung für die Kreuzvalidierung enthält.
    Dieses Feld ist nur anwendbar, wenn Sie unter N-fach und Foldzuweisung keinen Wert eingegeben haben.
  10. Aktivieren Sie Maximale Iterationen und geben Sie die Anzahl der Trainingsiterationen ein, die erfolgen sollen.
  11. Aktivieren Sie Ziel-Epsilon und geben Sie den Schwellenwert für die Konvergenz an. Dieser Wert musst zwischen 0 und 1 liegen. Wenn der Zielwert geringer ist als dieser Schwellenwert, wird das Modell konvergiert.
  12. Aktivieren Sie Beta-Epsilon und geben Sie den Schwellenwert für die Konvergenz an. Dieser Wert musst zwischen 0 und 1 liegen. Wenn der Zielwert geringer ist als dieser Schwellenwert, wird das Modell konvergiert. Wenn die L1-Normalisierung der aktuellen Beta-Änderung unter diesem Schwellenwert liegt, sollten Sie die Verwendung der Konvergenz in Erwägung ziehen.
  13. Klicken Sie auf OK, um das Modell und die Konfiguration zu speichern, oder fahren Sie mit der nächsten Registerkarte fort.