Machine Learning-Modul

Regelung

Sie können jetzt einen Regularisierungstyp auf Modelle mit Linear Regression und Logistic Regression anwenden, um die Überanpassung zu verwalten. Sie können zwischen den Typen LASSO, Ridge Regression oder Elastic Net wählen. Die Regularisierung kann mit den folgenden zusätzlichen neuen Feldern für beide Schritte optimiert werden:
  • Wert von Alpha
  • Wert von Lambda
  • Optimalen Wert von Lambda suchen
  • Frühzeitig stoppen
  • Maximale zu suchende Lambdas
  • Maximale Anzahl aktiver Prädikatoren

Weitere Informationen finden Sie unter „Konfigurieren der erweiterten Optionen“ für Linear Regression oder Logistic Regression im Machine Learning-Handbuch.

Modellmetrikport

Mit der neuen Ausgabe Modellmetrikport können Sie einen Datenausgabeschritt hinzufügen, um Modellbewertungsmetriken an eine Datendatei zu senden. Diese Informationen helfen Ihnen dabei, viele Modelle, die innerhalb und außerhalb von Spectrum™ Technology Platform generiert wurden, zu vergleichen und andere Datenverarbeitungsaufgaben an den Metriken auszuführen. Alternativ können Sie einen Überprüfungspunkt hinzufügen und eine Überprüfung für den Datenfluss durchführen, um diese Metriken in Enterprse Designer anzuzeigen. Dieser neue Ausgabeport ist für die folgenden Schritte verfügbar:
  • K-Means Clustering
  • Linear Regression
  • Logistic Regression
  • Principal Component Analysis
  • Random Forest Classification
  • Random Forest Regression

Aktualisierungen für die Verwaltung des Machine Learning-Moduls

Die Seite „Modellbewertung“ in der Machine Learning-Modellverwaltung enthält in dieser Version die folgenden Aktualisierungen:
  • Modelltyp: Ein neues Feld, das den vom Datenfluss erstellten Modelltyp angibt.
  • Erstellungszeit: Ein neues Feld, das das Datum und die Uhrzeit angibt, zu der das Modell erstellt wurde.
  • Lambda-Wert: Linear Regression und Logistic Regression enthalten diese neue Metrik, mit der die Menge der angewendeten Regularisierung gesteuert wird.
  • K-Means Clustering: Die Abbildungen für die folgenden drei Felder auf der Registerkarte „Modellübersicht“ der Seite „Modelldetails“ stammen nun aus Trainingsdaten:
    • Innerhalb der Cluster-Summe von Quadraten
    • Gesamtsumme von Quadraten
    • Zwischen der Cluster-Summe von Quadraten