Modulo Machine Learning

Regularización

Ahora puede aplicar un Tipo de regularización a los modelos de regresión lineal y regresión logística para ayudar a administrar el sobreajuste. Puede seleccionar entre los tipos LASSO, Ridge Regression o Elastic Net. La regularización se afina con estos nuevos campos adicionales para ambas etapas:
  • Valor de alfa
  • Valor de lambda
  • Búsqueda de valor óptimo de lambda
  • Detener antes
  • Cantidad máxima del valor lambda que se debe buscar
  • Cantidad máxima de predictores activos

Para obtener más información, consulte “Configuración de opciones avanzadas” de la regresión lineal o regresión logística en la Guía de Machine Learning.

Puerto de métricas de modelo

El nuevo Puerto de métricas de modelo de salida le permite adjuntar una etapa de salida de datos para enviar métricas de evaluación de modelo a un archivo de datos. Esta información lo ayudará a comparar muchos modelos generados desde dentro y fuera de Spectrum™ Technology Platform, y a realizar otras tareas de procesamiento de datos en las métricas. De manera alternativa, puede agregar un punto de inspección y ejecutar una inspección en el flujo de datos para ver estas métricas en Enterprise Designer. Este nuevo puerto de salida está disponible para las siguientes etapas:
  • K-Means Clustering
  • Regresión lineal
  • Logistic Regression
  • Análisis de componentes principales
  • Random Forest Classification
  • Regresión de bosques aleatorios

Actualizaciones de la administración de modelo de Machine Learning

La página Evaluación de modelo en Administración de modelo de aprendizaje automático tiene las siguientes actualizaciones en esta versión:
  • Tipo de modelo: campo nuevo para indicar el tipo de modelo que se creó con el flujo de datos.
  • Hora de creación: campo nuevo para indicar la fecha y la hora en que se creó el modelo.
  • Valor de lambda: Linear Regression y Logistic Regression contienen esta nueva métrica, que controla la cantidad de regularización aplicada.
  • K-Means Clustering: las cifras de los tres siguientes campos en la pestaña Resumen de modelo de la página Detalle de modelo ahora provienen de datos de capacitación:
    • Suma de cuadrados dentro del clúster
    • Suma total de cuadrados
    • Suma de cuadrados entre el clúster