Configuración de opciones avanzadas

  1. Deje marcada la opción Ignorar campos constantes para omitir campos que tienen el mismo valor para cada registro.
  2. Deje marcada la opción Calcular valores de p para calcular valores de p para las estimaciones de parámetros.
  3. Deje marcada la opción Quitar columna alineada para quitar automáticamente las columnas alineadas durante la construcción del modelo. Esto dará como resultado un coeficiente de 0 en el modelo devuelto.
    Esta opción debe estar marcada si la opción Calcular valores de p también está marcada.
  4. Deje marcada la opción Incluir término constante (interceptar) para incluir un término constante (interceptar) en el modelo.
    Debe marcar este campo si también marca la opción Quitar columna alineada.
  5. Seleccione un Solucionador de la lista desplegable. Tenga en cuenta que COORDINATE_DESCENT y COORDINATE_DESCENT_NAIVE se encuentran en etapa experimental.
    AUTO
    El solucionador se determinará en función de los datos y parámetros de entrada.
    COORDINATE_DESCENT
    IRLSM con la versión de actualizaciones de covarianza del descenso cíclico por coordenadas en el bucle interior.
    COORDINATE_DESCENT_NAIVE
    IRLSM con la versión de actualizaciones naive del descenso cíclico por coordenadas en el bucle interior.
    IRLSM
    Ideal para problemas con una pequeña cantidad de predictores o para búsquedas Lambda con penalidad L1.
    L_BFGS
    Ideal para conjuntos de datos con muchas columnas.
  6. Deje marcada la opción Propagar para N iteraciones e ingrese el número de propagación para garantizar que cuando los datos se dividan en datos de prueba y de capacitación, esto ocurra siempre de la misma manera cada vez que ejecute el flujo de datos. Deje “0” en este campo para obtener una división aleatoria cada vez que ejecuta el flujo.
  7. Marque la opción N iteraciones e ingrese la cantidad de iteraciones si va a realizar una validación cruzada.
  8. Marque la opción Asignación de iteración y seleccione la lista despegable si está ejecutando una validación cruzada. Este campo solo se aplica si ingresó un valor en N iteraciones y no se especificó el Campo de iteración.
    AUTO

    Permite que el algoritmo seleccione automáticamente una opción; actualmente utiliza Aleatorio.

    Módulo

    Divide de manera uniforme el conjunto de datos en las iteraciones y no depende de la raíz.

    Aleatorio

    Divide de manera aleatoria los datos en piezas de n iteraciones; es ideal para grandes conjuntos de datos.

    Estratificado

    Estratifica las iteraciones en función de la variable de respuesta para los problemas de clasificación. Distribuye de manera uniforme las observaciones de las diferentes clases en todos los conjuntos mediante la división de un conjunto de datos en datos de capacitación y de prueba. Puede resultar útil si hay muchas clases y el conjunto de datos es relativamente pequeño.

  9. Si está ejecutando una validación cruzada, marque la opción Campo de iteración y seleccione el campo que contiene la asignación del índice de iteración de validación cruzada en la lista desplegable.
    Este campo solo se aplica si no ingresó un valor en N iteraciones y Asignación de iteración.
  10. Marque la opción Iteración máxima e ingrese el número de iteraciones de capacitación que deben ocurrir.
  11. Marque la opción Objetivo épsilon e ingrese el umbral de convergencia; este debe ser un valor entre 0 y 1. Si el valor objetivo es menor que este umbral, el modelo se convergerá.
  12. Marque la opción Beta épsilon e ingrese el umbral de convergencia; este debe ser un valor entre 0 y 1. Si el valor objetivo es menor que este umbral, el modelo se convergerá. Si la normalización L1 del cambio beta actual está por debajo de este umbral, considere el uso de la convergencia.
  13. Haga clic en Aceptar para guardar el modelo y la configuración, o continúe a la ficha siguiente.