Configuration des options avancées

  1. Laissez la case Ignorer champs de constante cochée pour ignorer les champs qui ont la même valeur pour chaque enregistrement.
  2. Laissez la case Calculer valeurs p cochée pour calculer les valeurs de p pour les estimations de paramètres.
  3. Laissez la case Supprimer colonne colinéaire cochée pour supprimer automatiquement les colonnes colinéaires pendant la construction du modèle. Cela permet d'obtenir un coefficient 0 dans le modèle renvoyé.
    Cette option doit être cochée si la case Calculer valeurs p est également cochée.
  4. Laissez la case Inclure terme constant (Intercepter) cochée pour inclure un terme constant (interception) dans le modèle.
    Cette option doit être cochée si la case Supprimer colonne colinéaire est également cochée.
  5. Sélectionnez un Solver dans la liste déroulante. Notez que CoordinateDescentNaive et CoordinateDescentNaive sont actuellement des options expérimentales.
    Auto
    Solver est déterminé en fonction des paramètres et des données d’entrée.
    CoordinateDescentNaive
    IRLSM avec la covariance met à jour la version de descente des coordonnées cycliques dans la boucle la plus interne.
    CoordinateDescentNaive
    IRLSM avec la valeur naïve met à jour la version de descente des coordonnées cycliques dans la boucle la plus interne.
    IRLSM
    Idéal en cas de problèmes avec un petit nombre de prédicteurs ou pour les recherches Lambda avec une pénalité N1.
    L_BFGS
    Idéal pour les jeux de données avec de nombreuses colonnes.
  6. Laissez la case Seed pour N fois cochée et saisissez un numéro de seed pour vous assurer que lorsque les données sont divisées en données de test et de formation, cela se produit de la même manière chaque fois que vous exécutez le flux de données. Décochez ce champ pour obtenir une division aléatoire chaque fois que vous exécutez le flux.
  7. Cochez la case N fois et saisissez le nombre de fois si vous effectuez une validation croisée.
  8. Cochez Attribution de fois et faites votre choix dans la liste déroulante si vous effectuez une validation croisée. Ce champ s’applique uniquement si vous avez saisi une valeur dans N fois et si Champ Fois  n’est pas spécifié.
    Auto

    Permet à l’algorithme de sélectionner automatiquement une option ; actuellement, il utilise Random (Aléatoire).

    Modulo

    Distribue le jeu de données de façon égale dans les occurrences N fois et ne dépend pas du seed.

    Random

    Distribue les données de manière aléatoire dans les occurrences N fois ; recommandé pour les grands jeux de données.

    Stratified

    Stratifie les occurrences N fois en fonction de la variable de réponse pour les problèmes de classification. Répartit uniformément les observations des différentes classes dans tous les jeux lors de la division d’un jeu de données en données de formation et de test. Cela peut être utile s’il existe de nombreuses classes et si le jeu de données est relativement petit.

  9. Si vous effectuez une validation croisée, cochez la case Champ Fois et sélectionnez le champ qui contient l'affectation d'index fois la validation croisée dans la liste déroulante.
    Ce champ s’applique uniquement si vous n'avez pas saisi de valeur dans N fois ni dans Attribution de fois.
  10. Cochez Itérations maximales et saisissez le nombre d’itérations de formation qui doivent être effectuées.
  11. Cochez Epsilon Objectif et saisissez le seuil de convergence ; il doit s’agir d’une valeur comprise entre 0 et 1. Si la valeur d'objectif est inférieure à ce seuil, le modèle fait l'objet d'une convergence.
  12. Cochez Epsilon bêta et saisissez le seuil de convergence ; il doit s’agir d’une valeur comprise entre 0 et 1. Si la valeur d'objectif est inférieure à ce seuil, le modèle fait l'objet d'une convergence. Si la normalisation N1 du changement bêta actuel est inférieure à ce seuil, envisagez de recourir à la convergence.
  13. Cliquez sur OK pour enregistrer le modèle et la configuration ou pour passer à l’onglet suivant.