Configuration des options de base

  1. Laissez la case Normaliser les champs d’entrée cochée pour normaliser les colonnes numériques de sorte qu'elles n'aient pas de variance d'unité ni de moyenne.
    Si vous n’utilisez pas la normalisation, les résultats peuvent inclure des composants dominés par des variables apparaissant comme ayant des variances supérieures aux autres attributs comme échelle plutôt que comme véritable contribution.
  2. Cochez Évaluer les données en entrée pour ajouter une colonne pour la prédiction (l'évaluation) du modèle en fonction des données d'entrée.
  3. Sélectionnez une Fonction Lien dans la liste déroulante. Cette option indique le lien entre les composants aléatoires et systématiques. Elle indique la manière dont la valeur attendue de la réponse est reliée au prédicteur linéaire des variables explicatives.
    Identité
    Prédit les « probabilités » absurdes inférieures à zéro ou supérieures à un ; parfois utilisé pour les données binomiales pour obtenir un modèle de probabilité linéaire.

    g(p) = p

    Inverse

    Calcule l’inverse des fonctions Lien pour les estimations réelles.

    g(μi)=1μi

    Journal

    Compte les occurrences dans une quantité fixe de temps et d’espace.

    g(μi)=log(μi)

  4. Spécifiez comment gérer les données manquantes en cochant la case Ignorer ou Imputer les valeurs moyennes, qui ajoute la valeur moyenne de toutes les données manquantes.
  5. Spécifiez une valeur comprise entre 1 et 100 comme Pourcentage de données de formation lorsque les données d’entrée sont divisées de manière aléatoire en échantillons de données de formation et de test.
  6. Saisissez la valeur 100 moins le nombre que vous avez saisi à l’étape 5 comme Pourcentage de données de test.
  7. Saisissez un nombre pour Seed for sampling pour vous assurer que lorsque les données sont divisées en données de test et de formation, cela se produit de la même manière chaque fois que vous exécutez le flux de données. Décochez ce champ pour obtenir une division aléatoire chaque fois que vous exécutez le flux.
  8. Cliquez sur OK pour enregistrer le modèle et la configuration ou pour passer à l’onglet suivant.