基本オプションの設定
-
[ツリーの数] に、お使いのモデルでのツリー数の最大値を入力します。
-
[最大深度] に、モデルに含めるレベル数の最大値を入力します。
-
[最小行数] に、モデルに含める行数 (またはレコード数) の最小値を入力します。
-
[ビンの数 (数値)] に、ヒストグラムを構築したうえで最良のポイントで分割するビンの数を入力します。
-
[ビンの数 (最上位レベル)] に、ルート レベルで必要なビンの数の最小値を入力します。
-
[ビンの数 (カテゴリ別)] に、ヒストグラムを構築したうえで最良のポイントで分割するビンの数の最大値を入力します。
-
[サンプル レート] をオンにし、各ツリーでサンプルとして使用される行の比率を入力します。0.0 ~ 999 の値を使用できます。
-
[各ツリーの列サンプル レート] をオンにし、各ツリーの列に対するサンプリング率を入力します。0.0 ~ 1.0 の値を使用できます。
-
[各レベルの列数] をオンにし、すべてのレベルでの列のサンプリングに対する相対変化量を入力します。有効な値の範囲は、1.0 から、選択した入力予測因子の数値までです。デフォルトは 1.0 です。
-
モデル予測 (スコア) を表す列を入力データに追加するには、[入力データを記録] をオンにします。
-
入力データがトレーニングおよびテストのデータ サンプルにランダムに分割される場合は、1 ~ 100 の値を [トレーニング データの比率] に指定します。
-
ステップ 5 で指定した値を 100 から引いた値を [テスト データの比率] に入力します。
-
[テスト データ用シード] により、データフローを何度実行してもデータが必ず同じ方法でテスト データとトレーニング データに分割されるようになります。フローを実行するたびにランダムな分割を行う場合は、このフィールドをオフにします。
-
[OK] をクリックして、モデルと設定を保存するか、次のタブで操作を続行します。