classifiers.trees.J48


名前
weka.classifiers.trees.J48

構文
枝刈り有・無両方のC4.5決定木を生成するクラス.より詳しい情報は以下の文献を参照

Ross Quinlan (1993). "C4.5: Programs for Machine Learning", Morgan Kaufmann Publishers, San Mateo, CA.



オプション
binarySplits -- 名義属性の分割に二分分割を使うか(木を構築するときに).

confidenceFactor -- 信頼度は枝刈りに対して利用しました.(より小さい値はより多く枝刈りを行います)

debug -- trueに設定されると,分類学習アルゴリズムは追加インフォメーションをコンソールに出力します.

minNumObj -- 葉あたりの最小事例数

numFolds -- 誤り低減枝刈りのために利用するデータの量を決定してください. 1つの折り目部分集合は枝刈りのために利用され,残りは決定木の生成に利用します.

reducedErrorPruning -- 誤り低減枝刈りをC4.5方式の枝刈りの変わりに使用するかどうか.

saveInstanceData -- 訓練データを可視化のために保存するかどうか.

seed -- データをランダム化するのに種が利用されます.誤り低減枝刈りを利用するときに.

subtreeRaising -- 部分木の出現操作を枝刈りの際に考慮するかどうか.

unpruned -- 枝刈りを実行するかどうか.

useLaplace -- ラプラスに基づいて葉での数え上げが平滑化されるかどうかです.



  • 枝刈りしたりまたは枝刈りしないように拡張されたC4.5 Decision Treeである。
目的変数は名義尺度だけが許される。量的尺度や順序尺度は許されない。
しかし量的尺度をいくつかに分割してくれる<meta>が用意されている。
またpreprocessにも用意されている。これらを使うと量的尺度が名義尺度に変換される。本来ならば順序尺度としてJ48が扱えると理想ですが、残念ながらJ48は順序尺度を扱えません。あくまでも名義尺度としてしか扱えません。
しかし現実はおもしろいもので、量的尺度を5分割や3分割と分割数が
少ないときは、名義尺度として扱っても精度が落ちません。
まずは3分割して解析し、ものたりなかったら5分割して解析してみます。
この結果変なことが起こらなければこれを採用します。
試しに10分割して解析してみてください。変なことが起こっているはずです。順序の概念が消し去られているからです。
2006年04月19日(水) 17:32:47 Modified by ryu_toshinori

添付ファイル一覧(全1件)
classifiers.trees.LMT.gif (2.94KB)
Uploaded by ryu_toshinori 2006年04月13日(木) 19:53:30



スマートフォン版で見る