Configuration des options de base

  1. Laissez la case Normaliser les champs d’entrée cochée pour normaliser les colonnes numériques de sorte qu'elles n'aient pas de variance d'unité ni de moyenne.
    Si vous n’utilisez pas la normalisation, les résultats peuvent inclure des composants dominés par des variables apparaissant comme ayant des variances supérieures aux autres attributs comme échelle plutôt que comme véritable contribution.
  2. Cochez Évaluer les données en entrée pour ajouter une colonne pour la prédiction (l'évaluation) du modèle en fonction des données d'entrée.
  3. Cochez A priori si les données ont été échantillonnées et que la moyenne de réponse ne reflète pas la réalité ; ensuite, saisissez la probabilité d'a priori pour p(y==1) dans le champ de texte.
  4. Spécifiez comment gérer les données manquantes en cochant la case Ignorer ou Imputer les valeurs moyennes, qui ajoute la valeur moyenne de toutes les données manquantes.
  5. Spécifiez une valeur comprise entre 1 et 100 comme Pourcentage de données de formation lorsque les données d’entrée sont divisées de manière aléatoire en échantillons de données de formation et de test.
  6. Saisissez la valeur 100 moins le nombre que vous avez saisi à l’étape 5 comme Pourcentage de données de test.
  7. Saisissez un nombre pour Seed for sampling pour vous assurer que lorsque les données sont divisées en données de test et de formation, cela se produit de la même manière chaque fois que vous exécutez le flux de données. Décochez ce champ pour obtenir une division aléatoire chaque fois que vous exécutez le flux.
  8. Cliquez sur OK pour enregistrer le modèle et la configuration ou pour passer à l’onglet suivant.