以使用UserClassifier分類器建立決策樹為例,進一步了解分類器。
1、打開Explorer界面,選擇資料集segment-challenge.arff。
![](https://img.laitimes.com/img/__Qf2AjLwojIjJCLyojI0JCLiAzNfRHLGZkRGZkRfJ3bs92YsYTMfVmepNHL9EFWaVXNpJ2aONTW1NmMiNnStxEbahVYtpEWadnSYl1b5kHT20ESjBjUIF2X0hXZ0xCMx81dvRWYoNHLrdEZwZ1Rh5WNXp1bwNjW1ZUba9VZwlHdssmch1mclRXY39CXldWYtlWPzNXZj9mcw1ycz9WL49zZuBnLxAzN3MTNxIjM5EDMxkTMwIzLc52YucWbp5GZzNmLn9Gbi1yZtl2Lc9CX6MHc0RHaiojIsJye.png)
這是一個比較複雜的關于圖像分析的資料集。
詳情請看:https://blog.csdn.net/qq_42752823/article/details/102643706
2、打開classify面闆,選擇UserClassifier分類器。
若無此分類器,至Tools->package manager下載下傳即可。
3、選擇測試集segment-test.arff。
4、點選close。
5、點選start開始分類,将彈出一個含2個面闆的可視化視窗。選擇資料可視化面闆。
樹的可視化:
資料可視化:
6、如圖選擇region-centroid-row(Num)為x軸,intensity-mean(Num)為y軸。
7、使用合适的形狀選擇較整齊的資料點。
以使用矩形為例:
(1)選擇矩形。
(2)選擇整齊的資料點。這裡我先選擇了紫色的資料點(path)。
(3)點選submit,送出資料。紫色的資料點(sky)消失了。
(4)此時再檢視樹可視化面闆,不難看出節點得到了細化。
觀察左節點,剛剛送出的資料點共238個,分别是233個path節點,3個cement節點和2個grass節點。
(5)循環執行步驟1-3,進一步細化樹的節點。同時,還可改變x軸、y軸/選擇其他形狀(線段、多邊形)進行節點細化。
(6)對樹滿意後,右鍵選擇accept the tree接受樹。
(7)最終得到了一個正确率為78.1481%的分類結果。
思考
此方法嘗試了執行個體空間的不同區域,找了純度最高即資料點最整齊的區域進行覆寫,進而建立純度最高的分支。這是由底至上的方法。
而J48建立樹時是用整個資料集來劃分,在最頂端,将資料集一分為二,每次将剩下的一半資料建構成最優化的樹形。這是由頂至下的方法。
是以J48建立的樹比用UserClassifier分類器建立的更好。