unsupervised.attribute.Discretize


名前
weka.filters.unsupervised.attribute.Discretize

構文
さまざまな数値をdiscretizesするインスタンスフィルタ 名目上の属性へのデータセットの属性。 離散化が簡単な捨てることであります。 クラスをサボります。 設定されるなら、結果と考えます。

オプション
attributeIndices -- 影響する属性の範囲を指定してください。 これは属性インデックスリストのコンマの切り離されたリストです。 「「最初に」」と「「最後」」の有効値。 指定、包括的 「「--」」で、及んでください。 E.g: 「「第1-3(5、6-10)は持続します」。」

bins -- 容器の数。

desiredWeightOfInstancesPerInterval -- 1間隔あたりの例の必要な重さを設定します。等しい頻度の捨てること。

findNumBins -- 1つを省いた状態で等しい幅の容器使用の数を最適化してください。 doesn't等しい頻度の捨てるには、働いてください。

invertSelection -- 属性選択モードを設定してください。 選択されるだけです。 (数値)です。 範囲の属性はdiscretizedされるでしょう; if 本当に、非選択された属性だけがdiscretizedされるでしょう。

makeBinary -- 結果として起こる属性を2進にしてください。

useEqualFrequency -- の代わりにする本当の、そして、等しい頻度の捨てることへのセットが使用される。 等しい幅の捨てること。


離散化のデメリット:
数量尺度の説明変数を離散化しても順序の情報は残っている。しかし数量尺度の目的変数を離散化すると順序の情報が消失してしまうので、予測精度は確実に劣化する。できるだけ避けたい。もし離散化しても3分割までにしておく。
2006年04月19日(水) 17:29:33 Modified by ryu_toshinori

添付ファイル一覧(全1件)
unsupervised.attribute.Discretize.gif (2.95KB)
Uploaded by ryu_toshinori 2006年04月13日(木) 15:27:46



スマートフォン版で見る