天天看點

Weka之進一步了解分類器

以使用UserClassifier分類器建立決策樹為例,進一步了解分類器。

1、打開Explorer界面,選擇資料集segment-challenge.arff。

Weka之進一步了解分類器

這是一個比較複雜的關于圖像分析的資料集。

詳情請看:https://blog.csdn.net/qq_42752823/article/details/102643706

2、打開classify面闆,選擇UserClassifier分類器。

Weka之進一步了解分類器

若無此分類器,至Tools->package manager下載下傳即可。

Weka之進一步了解分類器

3、選擇測試集segment-test.arff。

Weka之進一步了解分類器

4、點選close。

Weka之進一步了解分類器

5、點選start開始分類,将彈出一個含2個面闆的可視化視窗。選擇資料可視化面闆。

樹的可視化:

Weka之進一步了解分類器

資料可視化:

Weka之進一步了解分類器

6、如圖選擇region-centroid-row(Num)為x軸,intensity-mean(Num)為y軸。

Weka之進一步了解分類器

7、使用合适的形狀選擇較整齊的資料點。

以使用矩形為例:

(1)選擇矩形。

Weka之進一步了解分類器

(2)選擇整齊的資料點。這裡我先選擇了紫色的資料點(path)。

Weka之進一步了解分類器

(3)點選submit,送出資料。紫色的資料點(sky)消失了。

Weka之進一步了解分類器

(4)此時再檢視樹可視化面闆,不難看出節點得到了細化。

Weka之進一步了解分類器

觀察左節點,剛剛送出的資料點共238個,分别是233個path節點,3個cement節點和2個grass節點。

(5)循環執行步驟1-3,進一步細化樹的節點。同時,還可改變x軸、y軸/選擇其他形狀(線段、多邊形)進行節點細化。

(6)對樹滿意後,右鍵選擇accept the tree接受樹。

Weka之進一步了解分類器

(7)最終得到了一個正确率為78.1481%的分類結果。

思考

此方法嘗試了執行個體空間的不同區域,找了純度最高即資料點最整齊的區域進行覆寫,進而建立純度最高的分支。這是由底至上的方法。

而J48建立樹時是用整個資料集來劃分,在最頂端,将資料集一分為二,每次将剩下的一半資料建構成最優化的樹形。這是由頂至下的方法。

是以J48建立的樹比用UserClassifier分類器建立的更好。