exp1

データを用意しよう。


マイニング界では超ありがち、irisデータを使いましょう。
持ってない人はココを開いて、
テキストファイルにコピーして、"iris.arff"と名前をつけてください。

データをKnowledgeFlowで読みこもう。

工事中。

KnowledgeFlowでFlowをくみたてよう。

工事中。
っていうか管理人がわかってないし。

EXAMPLE:


Setting up a flow to load an arff file (batch mode) and perform a cross validation using J48 (Wekas C4.5 implementation).

arffファイル(バッチ・モード)をロードして、J48(WekaのC4.5実装)を

使用することで交差検定を実行するためにフローをセッティングします。


First start the KnowlegeFlow.

まず最初に、KnowlegeFlowをスタートします。


Next click on the DataSources tab and choose "ArffLoader" from the toolbar (the mouse pointer will change to a "cross hairs").

次に、DataSourcesタブをクリックしてください、そして、ツールバーから"

ArffLoader"を選んでください。(マウス・ポインタは「十字」に変化するでしょう)


Next place the ArffLoader component on the layout area by clicking somewhere on the layout (A copy of the ArffLoader icon will appear on the layout area).

次に、arffLoaderコンポーネントを配置したレイアウトでクリックします。(ArffLoaderアイコンのコピーはレイアウト領域にでてきます)。


Next specify an arff file to load by first right clicking the mouse over the ArffLoader icon on the layout. A pop-up menu will appear. Select "Configure" under "Edit" in the list from this menu and browse to the location of your arff file.

次に、arffファイルをロードします。レイアウト領域のarffアイコンの上でマウスを右クリックします。そうするとポップアップメニューが表示されます。[編集]リストの[設定]を選択し、arffファイルを探して選択してください。


Next click the "Evaluation" tab at the top of the window and choose the "ClassAssigner" (allows you to choose which column to be the class) component from the toolbar. Place this on the layout.

次にウインドウ上部の[Evaluation]タブをクリックし、ツールバーから[ClassAssigner](どのカラムをクラスにするかあなたが選ぶ事が出来ます。)コンポーネントを選択してください。それをレイアウトに配置してください。


Now connect the ArffLoader to the ClassAssigner: first right click over the ArffLoader and select the "dataSet" under "Connections" in the menu. A "rubber band" line will appear. Move the mouse over the ClassAssigner component and left click - a red line labeled "dataSet" will connect the two components.

今度は、[ArffLoader]を[ClassAssigner]に接続してください: まず最初に、[ArffLoader]の上を右クリックしてください、そして、メニューで[接続]で[dataset]を選択してください。 ゴムのように伸び縮みする、赤いラインが現れるでしょう。 [ClassAssigner]上でクリックしたまま動かしてみてください。− [dataset]とラベルされている赤いラインは2コンポーネント間を繋いでいるはずです。


Next right click over the ClassAssigner and choose "Configure" from the menu. This will pop up a window from which you can specify which column is the class in your data (last is the default).

次に、[ClassAssigner]の上を右クリックしてください、そして、メニューからの[設定]を選んでください。 どのカラムがデータのクラスであるかを指定することができるウインドウをポップアップします(最初はデフォルトです)。


Next grab a "CrossValidationFoldMaker" component from the Evaluation toolbar and place it on the layout. Connect the ClassAssigner to the CrossValidationFoldMaker by right clicking over "ClassAssigner" and selecting "dataSet" from under "Connections" in the menu.

次は、Evaluationツールバーから"CrossValidationFoldMaker"コンポーネントをつかんで、それをレイアウトに置きます。

"ClassAssigner"の上を右クリックして、メニューで「接続」で「dataset」を選択し、ClassAssignerをCrossValidationFoldMakerに接続してください。


Next click on the "Classifiers" tab at the top of the window and scroll along the toolbar until you reach the "J48" component in the "trees" section. Place a J48 component on the layout.

次に「Classifiers」タブをクリックして「trees」セクションの[J48]コンポーネントを選択肢、レイアウトしてください。


Connect the CrossValidationFoldMaker to J48 TWICE by first choosing "trainingSet" and then "testSet" from the pop-up menu for the CrossValidationFoldMaker.

最初にCrossValidationFoldMakerを2度、J48に接続してください。

CrossValidationFoldMakerのポップアップメニューからの"trainingSet"と"testSet"、選びます。


Next go back to the "Evaluation" tab and place a "ClassifierPerformanceEvaluator" component on the layout. Connect J48 to this component by selecting the "batchClassifier" entry from the pop-up menu for J48.

次に、「Evaluation」タブに戻ってください。そして、"ClassifierPerformanceEvaluator"コンポーネントをレイアウトしてください。

このコンポーネントにJ48を接続するためにJ48のためのポップアップメニューから"batchClassifier"エントリーを選択してください。


'''Next go to the "Visualization" toolbar and place a "TextViewer" component on the layout. Connect the ClassifierPerformanceEvaluator to the TextViewer by selecting the "text" entry from the pop-up menu for
ClassifierPerformanceEvaluator.'''

次に、レイアウトの「Visualization」ツールバーの"TextViewer"コンポーネントを選択してください。 ClassifierPerformanceEvaluatorのポップアップメニューから「text」エントリーを選択して、ClassifierPerformanceEvaluatorをTextViewerに接続してください。


Now start the flow executing by selecting "Start loading" from the pop-up menu for ArffLoader. Depending on how big the data set is and how long cross validation takes you will see some animation from some of the icons in the layout (J48s tree will "grow" in the icon and the ticks will animate on the ClassifierPerformanceEvaluator). You will also see some progress information in the "Status" bar and "Log" at the bottom of the window.

ううう翻訳無理ぽ


今度は、ArffLoaderのポップアップメニューから「start loading」を選択することによって、フローを実行し始めてください。 データセットがどれくらい大きいか、そして、交差検証はいくつかのレイアウトにあるアイコンのアニメーションからどれくらい長いか見ることが出来るでしょう(J48の木がアイコンで「grow」、そして、ticksはClassifierPerformanceEvaluatorで活気づけるでしょう)。 また、あなたは窓の下部の「状態」バーと「ログ」の何らかの進歩情報を見るでしょう。



When finished you can view the results by choosing show results from the pop-up menu for the TextViewer component.

終わったら、TextViewerの部品のためのポップアップメニューからシ

ョー結果を選ぶことによって、結果を見ることができます。

Other cool things to add to this flow: connect a TextViewer and/or a GraphViewer to J48 in order to view the textual or graphical representations of the trees produced for each fold of the cross validation (this is something that is not possible in the Explorer).

他にもこのフローにクールな仕組みを追加できます。:

テクスチャ、もしくは交差検証の各折り目のために生産された木のグラフをを見るために、GraphViewerやTextViewerをJ48に接続してみてください。

2006年04月19日(水) 01:04:03 Modified by ryu_toshinori




スマートフォン版で見る