機器學習筆記-第二章模型評估與選擇2

2023-05-13 08:17:07

本節預設以錯誤率為性能度量，用 ϵ \epsilon ϵ表示。

比較檢驗

1 假設檢驗

泛化錯誤率 ϵ \epsilon ϵ：在一個樣本上犯錯的機率是 ϵ \epsilon ϵ。

測試錯誤率 ϵ ^ \hat{\epsilon} ϵ^：在 m m m個測試樣本中恰有 ϵ ^ × m \hat{\epsilon}\times m ϵ^×m個被誤分類。

泛化錯誤率為 ϵ \epsilon ϵ的學習器将其中 m ′ m' m′個樣本誤分類、其餘樣本全部分類正确的機率是 ϵ m ′ ( 1 − ϵ ) m − m ′ \epsilon^{m'}(1-\epsilon)^{m-m'} ϵm′(1−ϵ)m−m′。

将 ϵ ^ × m \hat{\epsilon}\times m ϵ^×m個樣本誤分類的機率為：（在包含 m m m個樣本的測試集上，泛化錯誤率為 ϵ \epsilon ϵ學習器被測得測試錯誤率為 ϵ ^ \hat{\epsilon} ϵ^的機率）

P ( ϵ ^ ; ϵ ) = ( m ϵ ^ × m ) ϵ ϵ ^ × m ( 1 − ϵ ) m − ϵ ^ × m P(\hat{\epsilon};\epsilon)=\left( \begin{array}{c} m \\ \hat{\epsilon}\times m \end{array} \right)\epsilon^{\hat{\epsilon}\times m}(1-\epsilon)^{m-\hat{\epsilon}\times m} P(ϵ^;ϵ)=(mϵ^×m)ϵϵ^×m(1−ϵ)m−ϵ^×m

機器學習筆記-第二章模型評估與選擇2

比較檢驗

1 假設檢驗

2 交叉驗證 t t t檢驗

3 McNemar檢驗

4 Friedman檢驗與Nemenyi後續檢驗

偏差與方差

繼續閱讀

簡單文檔分類——樸素貝葉斯算法樸素貝葉斯算法簡單文檔分類執行個體步驟總結樸素貝葉斯分類調用(sklearn)

【分類算法】什麼是分類算法定義分類與聚類分類過程方法

分類算法的評價名額

K-近鄰算法以及圖像分類應用

weka之NB算法

使用weka的select attribute

weka中分類器算法

在weka中內建自己的算法

【多變量線性回歸】學習記錄序思路實作終

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告