FrontPage
wekaのwikiようこそ
wekaはどこかの大学がJAVAで作ったオープンソースな
Knowledge(ナレッジ)分析の統合環境です。
貧者のClementineかな?
Weka_3.4.7を参考に、勉強を兼ねて翻訳・解説していきます。
weka全体ではなくKnowldgeFlowの部分に注力します。見た目がかっこいいから。
※※ごめんなさい。※※
あとあと余裕ができたら現状バージョンにマージしよう。
難しい用語ってたくさんありますよね。
まぁまいにんぐ自体数式とかおおくて難しいんですけど。
なるべく簡単に解説できたらいいなぁって
wekaとは何か
データマイニング・WEKA
"weka"の操作方法
musashi
boostingなどの集団学習の説明
boostingなどの集団学習の説明2
weka faq
Bayesian Network Classifiers in Weka
ISFI - 松本 健: ベイジアンネット アーカイブ
印刷する事
wekaはどこかの大学がJAVAで作ったオープンソースな
Knowledge(ナレッジ)分析の統合環境です。
貧者のClementineかな?
Weka_3.4.7を参考に、勉強を兼ねて翻訳・解説していきます。
weka全体ではなくKnowldgeFlowの部分に注力します。見た目がかっこいいから。
※※ごめんなさい。※※
あえて、ウェブのルールを無視して、いいと思った部分を引用(パクり)しまくっています。ごめんなさい。ほんとうにごめんなさい。でもこのサイトは僕のノートみたいなものなんです。
そしてできれば協力してください。高卒にもわかるくらいに優しく解説してもらえると本当に涙が出るほど嬉しい。
とりあえずつかってみよう
- 例1 とりあえずirisデータを決定木(J48)にかけてみない?
- 例2 とりあえずirisデータをニューラルネットにかけてみない??
WekaKnowledgeFlow
- DataSources データ読み込み?
- DataSinks データ保存?
Filters フィルター
- supervised 教師付き
- 属性(カラム)フィルタ
- AttributeSelection
目的変数に寄与の大きい説明変数を選択する - ClassOrder
- Discretize
離散化 - NominalToBinary
名義尺度を2値化する。 例) 男,女→0,1 A,B,AB,O→00,01,10,00
- AttributeSelection
- インスタンス(レコード)フィルタ
- 属性(カラム)フィルタ
- unsupervised 教師無し
- 属性(カラム)フィルタ
- Add
- AddCluster
- AddExpression
Excelのカラムみたいにa1*a2みたいにして属性追加 - AddNoise
- ChangeDateFormat
- ClusterMembership
- Copy
- Discretize
- FirstOrder
- MakeIndicator
- MergeTwoValues
名義尺度の属性(カラム)を指定。
混ぜ合わせて一緒にしたい二つのラベル(カラムの値?)を指定したらそれが一つになる。(とおもう)
良く使うらしい。 - NominalToBinary
名義尺度を2値化する。 例) 男,女→0,1 A,B,AB,O→00,01,10,00 - Nomalize
- NumericToBinary
- NumericTransform
- Obfuscate
- PKIDiscretize
- RandomProjection
- Remove
指定された範囲のデータを統一しちゃう。つまり消すってこと。
良く使うらしい - RemoveType
- RemoveUseless
- ReplaceMissingValues
- Standardize
- StringToNominal
- StringToWordVector
- SwapValues
- TimeSeriesDelta
- TimeSeriesTranslate
- インスタンス(レコード)フィルタ
- 属性(カラム)フィルタ
- Classifiers 分類
- bayes
- functions?
- lazy?
- meta?
- AdaBoostM1
◎事例を捨てずに重みをつけて何度も学習し多数決で決める。ノイズが少ないデータで効果が大きい。 - AdditiveRegression
◎二番目以降の要因を計算する。DecisionStumpやConjunctiveRuleに有効。 - AttributeSelectedClassifier
- Bagging
◎事例を複数回サンプリングし出力を安定させる。ニューロみたいに出力が不安定なclassifierに有効。 - ClassificationViaRegression
- CostSensitiveClassifier
- CVParameterSelection
- Decorate
- FilteredClassifier
説明変数を選択する - Grading
- LogitBoost
- MetaCost
- MultiBoostAB
- MultiClassClassifier
- MultiScheme
複数のclassifierを動かして、正確度の高い結果を採用する。 - OrdinalClassClassifier
名義変数を順序変数として扱う。 - RacedIncrementalLogitBoost
- RandomCommittee?
- RegressionByDiscretization
◎量的尺度の目的変数を分割し、名義尺度に変換する。 - Stacking
- StackingC
- ThresholdSelector
- Vote
- AdaBoostM1
- tree?
- rules?
Evaluation?
- TrainingSetMaker
- TestSetMaker
- CrossValidationFoldMaker
- TrainTestSplitMaker
- ClassAssigner
- ClassValuePicker
- ClassifierPerformanceEvaluator
- IncrementalClassifierEvaluator
- ClustererPerformanceEvaluator
- PredictionAppender
Evaluation?
あれどこかバージョン低いのを訳してしまった。あとあと余裕ができたら現状バージョンにマージしよう。
- TrainingSetMaker
トレーニングセットにデータセットを作りかえます。 - TestSetMaker
テストセットにデータセットを作りかえます。 - CrossValidationFoldMaker
交差検定に応じて、インスタンスをトレーニングセットテスト・セットに分けます。 - TrainTestSplitMaker
データセットorトレーニングセットorテストセットを受け取り、ランダムにインスタンスから分割してトレーニング・テストセット両方を作り出します。 - ClassAssigner
トレーニングセット、テストセットデータに対して、クラスになるようなカラムを割り当ててください。 - ClassifierPerformanceEvaluator
トレーニング・テストの分類のバッチを評価する。 - IncrementalClassifierEvaluator
evaluate the performance of incrementally trained classifiers
Visualization?
- DataVisualizer?
コンポーネントは大きな2Dの散布図のプロット画面をひとつ表示して、データをビジュアライズする事ができます。 - ScatterPlotMatrix?
小さい散布プロット図をマトリックス表示した画面をポップアップします。(小さいプロット図をクリックすると大きいプロット図が表示されます) - AttributeSummarizer?
小さなヒストグラム図をマトリックス表示した画面を表示します
one for each of the attributes in the input data
入力データのそれぞれの属性のための1(翻訳ワカラナいス) - GraphViewer?
木構造をビジュアライズするためのパネルを表示します。 - StripChart?
スクロールプロット図(なんじゃそりゃ)を表示します。 (incremental 分類のオンラインパフォーマンスを見るために、使用されます。)
weka(マイニング)の用語解説
難しい用語ってたくさんありますよね。
まぁまいにんぐ自体数式とかおおくて難しいんですけど。
なるべく簡単に解説できたらいいなぁって
リンク
wekaとは何か
データマイニング・WEKA
"weka"の操作方法
musashi
boostingなどの集団学習の説明
boostingなどの集団学習の説明2
weka faq
Bayesian Network Classifiers in Weka
ISFI - 松本 健: ベイジアンネット アーカイブ
印刷する事
2006年04月22日(土) 20:24:59 Modified by ryu_toshinori