Module Machine Learning

Régularisation

Vous pouvez maintenant appliquer un type de régularisation aux modèles Linear Regression et Logistic Regression pour vous aider à gérer le surajustement. Vous pouvez effectuer une sélection parmi les types LASSO, Ridge Regression et Elastic Net. La régularisation peut être affinée avec ces nouveaux champs supplémentaires pour les deux stages :
  • Valeur d'alpha
  • Valeur de lambda
  • Rechercher la valeur de lambda optimale
  • Arrêter tôt
  • Lambdas maximum à rechercher
  • Nombre maximal de prédicteurs actifs

Pour plus d'informations, voir « Configuration des options avancées » pour Linear Regression ou Logistic Regression dans le Guide Machine Learning.

Port de métriques du modèle

La nouvelle sortie Port de métriques de modèle vous permet de joindre un stage de sortie de données pour envoyer des métriques d'évaluation de modèle à un fichier de données. Ces informations vous aident à comparer de nombreux modèles générés de l'intérieur et à l'extérieur de Spectrum™ Technology Platform et à effectuer d'autres tâches de traitement de données sur les métriques. Vous pouvez également ajouter un point d'inspection et exécuter une inspection sur le dataflow pour afficher ces métriques dans Enterprise Designer. Ce nouveau port de sortie est disponible pour les stages suivants :
  • K-Means Clustering
  • Linear Regression
  • Logistic Regression
  • Principal Component Analysis
  • Random Forest Classification
  • Random Forest Regression

Mises à jour de Machine Learning Module Management

Dans cette version, la page Évaluation du modèle de Machine Learning Model Management contient les mises à jour suivantes :
  • Type de modèle — Nouveau champ indiquant le type de modèle créé par le dataflow.
  • Heure de création — Nouveau champ indiquant la date et l'heure de création du modèle.
  • Valeur de lambda — Linear Regression et Logistic Regression contiennent cette nouvelle métrique, qui contrôle la quantité de régularisation appliquée.
  • K-Means Clustering — Les chiffres des trois champs suivants de l'onglet Résumé du modèle de la page Détail du modèle proviennent désormais des données d'apprentissage :
    • Au sein de la somme de clusters de carrés
    • Somme totale des carrés
    • Entre la somme de clusters de carrés