Configuration des options de base

  1. Saisissez le Nombre d'arborescences maximal de votre modèle.
  2. Saisissez la Profondeur maximale, ou le nombre maximal de niveaux que vous souhaitez que votre modèle contienne.
  3. Saisissez les Lignes minimales : le nombre minimal de lignes (ou d'enregistrements) que vous souhaitez que votre modèle contienne.
  4. Saisissez le Nombre de bins numériques : le nombre de bins que vous souhaitez que l’histogramme génère, puis divise au meilleur point.
  5. Saisissez le Nombre de bins de niveau supérieur : le nombre minimal de bins que vous souhaitez au niveau racine.
  6. Saisissez le Nombre de bins catégoriques : le nombre maximal de bins que vous souhaitez que l’histogramme crée, puis divise au meilleur point.
  7. Cochez la case Taux d'échantillonnage et saisissez le pourcentage de lignes à utiliser comme échantillon dans chaque arborescence. Cette valeur peut varier de 0,0 à 0,999.
  8. Cochez la case Taux d'échantillonnage de colonnes par arborescence et saisissez le taux d’échantillonnage de colonnes pour chaque arborescence. Cette valeur peut varier de 0,0 à 1,0.
  9. Cochez la case Colonnes à chaque niveau et saisissez la modification relative du taux d’échantillonnage de colonnes pour chaque niveau. Plage de valeurs valides de 1,0 au nombre d'éléments du prédicteur d'entrée sélectionné. La valeur par défaut est 1,0.
  10. Cochez Évaluer les données en entrée pour ajouter une colonne pour la prédiction (l'évaluation) du modèle en fonction des données d'entrée.
  11. Spécifiez une valeur comprise entre 1 et 100 comme Pourcentage de données de formation lorsque les données d’entrée sont divisées de manière aléatoire en échantillons de données de formation et de test.
  12. Saisissez la valeur 100 moins le nombre que vous avez saisi à l’étape 5 comme Pourcentage de données de test.
  13. Alimenter pour générer les données de test pour vous assurer que lorsque les données sont divisées en données de test et de formation, cela se produit de la même manière chaque fois que vous exécutez le flux de données. Décochez ce champ pour obtenir une division aléatoire chaque fois que vous exécutez le flux.
  14. Cliquez sur OK pour enregistrer le modèle et la configuration ou pour passer à l’onglet suivant.