Configuration des options avancées

  1. Laissez la case Ignorer champs de constante cochée pour ignorer les champs qui ont la même valeur pour chaque enregistrement.
  2. Cochez la case Calculer valeurs p pour calculer les valeurs de p pour les estimations de paramètres.
  3. Cochez la case Supprimer colonne colinéaire pour supprimer automatiquement les colonnes colinéaires pendant la construction du modèle. Cela permet d'obtenir un coefficient 0 dans le modèle renvoyé.
    Cette option doit être cochée si la case Calculer valeurs p est également cochée.
  4. Laissez la case Inclure terme constant (Intercepter) cochée pour inclure un terme constant (interception) dans le modèle.
    Cette option doit être cochée si la case Supprimer colonne colinéaire est également cochée.
  5. Sélectionnez un Solver dans la liste déroulante. Notez que CoordinateDescent et CoordinateDescentNaive sont actuellement des options expérimentales.
    Auto
    Solver est déterminé en fonction des paramètres et des données d’entrée.
    CoordinateDescent
    IRLSM avec la covariance met à jour la version de descente des coordonnées cycliques dans la boucle la plus interne.
    CoordinateDescentNaive
    IRLSM avec la valeur naïve met à jour la version de descente des coordonnées cycliques dans la boucle la plus interne.
    IRLSM
    Idéal en cas de problèmes avec un petit nombre de prédicteurs ou pour les recherches Lambda avec une pénalité N1.
    LBFGS
    Idéal pour les jeux de données avec de nombreuses colonnes.
  6. Laissez la case Seed pour N fois cochée et saisissez un numéro de seed pour vous assurer que lorsque les données sont divisées en données de test et de formation, cela se produit de la même manière chaque fois que vous exécutez le flux de données. Décochez ce champ pour obtenir une division aléatoire chaque fois que vous exécutez le flux.
  7. Cochez la case N fois et saisissez le nombre de fois si vous effectuez une validation croisée.
  8. Cliquez sur Attribution de fois et faites votre choix dans la liste déroulante si vous effectuez une validation croisée. Ce champ s’applique uniquement si vous avez saisi une valeur dans N fois et si Champ Fois  n’est pas spécifié.
    Auto

    Permet à l’algorithme de sélectionner automatiquement une option ; actuellement, il utilise Random (Aléatoire).

    Modulo

    Distribue le jeu de données de façon égale dans les occurrences N fois et ne dépend pas du seed.

    Random

    Distribue les données de manière aléatoire dans les occurrences N fois ; recommandé pour les grands jeux de données.

  9. Si vous effectuez une validation croisée, cochez la case Champ Fois et sélectionnez le champ qui contient l'affectation d'index fois la validation croisée dans la liste déroulante.
    Ce champ s’applique uniquement si vous n'avez pas saisi de valeur dans N fois ni dans Attribution de fois.
  10. Cochez Itérations maximales et saisissez le nombre d’itérations de formation qui doivent être effectuées.
  11. Cochez Epsilon Objectif et saisissez le seuil de convergence ; il doit s’agir d’une valeur comprise entre 0 et 1. Si la valeur d'objectif est inférieure à ce seuil, le modèle fait l'objet d'une convergence.
  12. Cochez Epsilon bêta et saisissez le seuil de convergence ; il doit s’agir d’une valeur comprise entre 0 et 1. Si la valeur d'objectif est inférieure à ce seuil, le modèle fait l'objet d'une convergence. Si la normalisation N1 du changement bêta actuel est inférieure à ce seuil, envisagez de recourir à la convergence.
  13. Cliquez sur OK pour enregistrer le modèle et la configuration ou pour passer à l’onglet suivant.