Boosting學習（一）——PAC學習模型到Boosting

2023-07-02 09:18:21

PAC ( Probably Approximately Correct)可能近似正确學習模型
因為我們不能指望學習能夠零錯誤，并且也不能要求對任意資料的預測能夠成功，但是我們需要将錯誤率和預測失敗率控制在一定範圍内，也就是近似正确，而不是以1為名額的。
定義 (PAC Model)：我們稱一個 concept class C 是 PAC 可學習的，如果存在一個算法 L ，使得對任意的 target concept c∈C ，以及任意 X 上的分布 μ ，和任意 0<ϵ<1/2 、0<δ<1/2 ，在給定 oracle EX(c,μ) 以及 ϵ、δ 的情況下，L 能夠以至少 1−δ 的機率得到一個 hypothesis concept h∈C ，滿足誤差 E(h)≤ϵ 。如果 L 的運作時間複雜度關于 1/ϵ 、1/δ 、輸入空間 X 的次元以及 target concept c 的大小是多項式的，我們則稱 C 是 efficiently PAC learnable 的。
強可學習：一個多項式的學習算法，正确率很高（>(1-ϵ)）。
弱可學習：一個多項式學習算法，正确率僅比随機猜想略高。
弱可學習可以提升為強可學習。
弱學習器提升為強學習器的過程稱為Boosting。
Boosting可以産生一系列的學習器，後産生的學習器的訓練集取決于之前的産生的學習器，之前被誤判的示例在之後獲得較大的機率。

繼續閱讀