天天看點

機器學習筆記-第二章模型評估與選擇2

本節預設以錯誤率為性能度量,用 ϵ \epsilon ϵ表示。

比較檢驗

1 假設檢驗

泛化錯誤率 ϵ \epsilon ϵ:在一個樣本上犯錯的機率是 ϵ \epsilon ϵ。

測試錯誤率 ϵ ^ \hat{\epsilon} ϵ^:在 m m m個測試樣本中恰有 ϵ ^ × m \hat{\epsilon}\times m ϵ^×m個被誤分類。

泛化錯誤率為 ϵ \epsilon ϵ的學習器将其中 m ′ m' m′個樣本誤分類、其餘樣本全部分類正确的機率是 ϵ m ′ ( 1 − ϵ ) m − m ′ \epsilon^{m'}(1-\epsilon)^{m-m'} ϵm′(1−ϵ)m−m′。

将 ϵ ^ × m \hat{\epsilon}\times m ϵ^×m個樣本誤分類的機率為:(在包含 m m m個樣本的測試集上,泛化錯誤率為 ϵ \epsilon ϵ學習器被測得測試錯誤率為 ϵ ^ \hat{\epsilon} ϵ^的機率)

P ( ϵ ^ ; ϵ ) = ( m ϵ ^ × m ) ϵ ϵ ^ × m ( 1 − ϵ ) m − ϵ ^ × m P(\hat{\epsilon};\epsilon)=\left( \begin{array}{c} m \\ \hat{\epsilon}\times m \end{array} \right)\epsilon^{\hat{\epsilon}\times m}(1-\epsilon)^{m-\hat{\epsilon}\times m} P(ϵ^;ϵ)=(mϵ^×m​)ϵϵ^×m(1−ϵ)m−ϵ^×m

機器學習筆記-第二章模型評估與選擇2
機器學習筆記-第二章模型評估與選擇2
機器學習筆記-第二章模型評估與選擇2
機器學習筆記-第二章模型評估與選擇2
2 交叉驗證 t t t檢驗
3 McNemar檢驗
4 Friedman檢驗與Nemenyi後續檢驗

偏差與方差

繼續閱讀