基本オプションの設定

[ツリーの数] に、お使いのモデルでのツリー数の最大値を入力します。
[最大深度] に、モデルに含めるレベル数の最大値を入力します。
[最小行数] に、モデルに含める行数 (またはレコード数) の最小値を入力します。
[ビンの数 (数値)] に、ヒストグラムを構築したうえで最良のポイントで分割するビンの数を入力します。
[ビンの数 (最上位レベル)] に、ルートレベルで必要なビンの数の最小値を入力します。
[ビンの数 (カテゴリ別)] に、ヒストグラムを構築したうえで最良のポイントで分割するビンの数の最大値を入力します。
[サンプルレート] をオンにし、各ツリーでサンプルとして使用される行の比率を入力します。0.0 ～ 999 の値を使用できます。
[各ツリーの列サンプルレート] をオンにし、各ツリーの列に対するサンプリング率を入力します。0.0 ～ 1.0 の値を使用できます。
[各レベルの列数] をオンにし、すべてのレベルでの列のサンプリングに対する相対変化量を入力します。有効な値の範囲は、1.0 から、選択した入力予測因子の数値までです。デフォルトは 1.0 です。
モデル予測 (スコア) を表す列を入力データに追加するには、[入力データを記録] をオンにします。
入力データがトレーニングおよびテストのデータサンプルにランダムに分割される場合は、1 ～ 100 の値を [トレーニングデータの比率] に指定します。
ステップ 5 で指定した値を 100 から引いた値を [テストデータの比率] に入力します。
[テストデータ用シード] により、データフローを何度実行してもデータが必ず同じ方法でテストデータとトレーニングデータに分割されるようになります。フローを実行するたびにランダムな分割を行う場合は、このフィールドをオフにします。
[OK] をクリックして、モデルと設定を保存するか、次のタブで操作を続行します。