機器學習——神經網絡累積BP算法

2023-03-07 00:16:14

在上篇的部落格介紹的“标準BP算法”每次僅針對一個訓練樣例更新連接配接權和門檻值，也就是說，BP算法中的更新規則是基于單個的

機器學習——神經網絡累積BP算法

推導而得，如果類似的推導出基于累積誤差最小化的更新規則，就得到了累積誤差逆傳播算法。累積BP算法與标準BP算法都很常用（标準BP算法和累積BP算法的差別類似于随機梯度下降(Stochastic gradient descent,簡稱 SGD)于标準梯度下降之間的差別）。一般來說，标準BP算法每次更新隻針對單個樣例，參數更新得非常頻繁，而且對不同樣例進行更新的效果可能出現“抵消”現象。是以，為了達到同樣的累積誤差極小點，标準BP算法往往需要更多次數的疊代。累積BP算法直接針對累積誤差最小化，它在讀取整個訓練集D一遍之後才對參數進行更新，其參數更新的頻率低的多。但在很多任務中，累積誤差下降到一程度之後，進一步下降會非常緩慢，這時标準BP往往會更快獲得較好的了解，尤其是訓練集D非常大時更明顯。

正是由于其強大的表示能力，BP神經網絡經常遭遇過拟合，其訓練誤差持續降低，但測試誤差卻可能上升。

通常有兩種政策來緩解BP網絡的過拟合。第一種政策是“早停”(early stopping)：将資料分成訓練集合驗證集，訓練集用來計算梯度、更新連接配接權和門檻值，驗證集用來估計誤差，若訓練集誤差降低但驗證集誤差升高，則停止訓練，同時傳回具有最小驗證集誤差的連接配接權和門檻值。第二種政策是“正則化”(regularization),其基本思想是在誤差目标函數中增加一個用于描述網絡複雜度的部分，例如連接配接權和門檻值的平方和。仍令

機器學習——神經網絡累積BP算法

表示第k個訓練樣例上的誤差，

機器學習——神經網絡累積BP算法

表示連接配接權和門檻值，則誤差目标函數(5.16)改變為

機器學習——神經網絡累積BP算法

其中，

機器學習——神經網絡累積BP算法

用于對經驗誤差與網絡複雜度這兩項進行折中，常通過交叉驗證法來估計。

參考：

《機器學習》周志華著

機器學習——神經網絡累積BP算法

繼續閱讀

簡單文檔分類——樸素貝葉斯算法樸素貝葉斯算法簡單文檔分類執行個體步驟總結樸素貝葉斯分類調用(sklearn)

【分類算法】什麼是分類算法定義分類與聚類分類過程方法

分類算法的評價名額

K-近鄰算法以及圖像分類應用

weka之NB算法

使用weka的select attribute

weka中分類器算法

在weka中內建自己的算法

【多變量線性回歸】學習記錄序思路實作終

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告