Configuration des options de base

  1. Saisissez le Nombre d'arborescences maximal de votre modèle. La valeur par défaut est 50.
  2. Saisissez la Profondeur maximale, ou le nombre maximal de niveaux que vous souhaitez que votre modèle contienne. La valeur par défaut est 5.
  3. Saisissez les Lignes minimales : le nombre minimal de lignes (ou d'enregistrements) que vous souhaitez que votre modèle contienne. La valeur par défaut est 10.
  4. Saisissez le Nombre de bins numériques : le nombre de bins que vous souhaitez que l’histogramme génère, puis divise au meilleur point. La valeur par défaut est 20.
  5. Saisissez le Nombre de bins de niveau supérieur : le nombre minimal de bins que vous souhaitez au niveau racine. La valeur par défaut est 1 024.
  6. Saisissez le Nombre de bins catégoriques : le nombre maximal de bins que vous souhaitez que l’histogramme crée, puis divise au meilleur point. La valeur par défaut est 1 024.
  7. Cochez la case Taux d'échantillonnage et saisissez le pourcentage de lignes à utiliser comme échantillon dans chaque arborescence. Cette valeur peut varier de 0,0 à 1,0.
  8. Cochez la case Taux d'échantillonnage de colonnes par arborescence et saisissez le taux d’échantillonnage de colonnes pour chaque arborescence. Cette valeur peut varier de 0,0 à 1,0.
  9. Colonnes à chaque niveau spécifie les colonnes à sélectionner au hasard à chaque niveau. Si cette option est décochée, la valeur par défaut -1 est utilisée et le nombre de variables est la racine carrée du nombre de colonnes pour la classification et p/3 pour la régression (où p est le nombre de prédicteurs). Si vous cochez l’option, vous pouvez spécifier une valeur supérieure ou égale à 1. La valeur spécifiée ne peut pas être supérieure au nombre de prédicteurs.
  10. Cochez Évaluer les données en entrée pour ajouter une colonne pour la prédiction (l'évaluation) du modèle en fonction des données d'entrée.
  11. Spécifiez une valeur comprise entre 1 et 100 comme Pourcentage de données de formation lorsque les données d’entrée sont divisées de manière aléatoire en échantillons de données de formation et de test.
  12. Saisissez la valeur 100 moins le nombre que vous avez saisi à l’étape 5 comme Pourcentage de données de test.
  13. Alimenter pour générer les données de test pour vous assurer que lorsque les données sont divisées en données de test et de formation, cela se produit de la même manière chaque fois que vous exécutez le flux de données. Décochez ce champ pour obtenir une division aléatoire chaque fois que vous exécutez le flux.
  14. Cliquez sur OK pour enregistrer le modèle et la configuration ou pour passer à l’onglet suivant.