深度學習——預訓練深度網絡存在問題:網絡越深，需要的訓練樣本數越多。若用監督則需大量标注樣本，不然小規模樣本容易造成過拟合（深層網絡意味着特征比較多，機器學習裡面臨多特征：1、多樣本 2、規則化 3、特征選擇）；多層神經網絡參數優化是個高階非凸優化問題，常收斂較差的局部解；梯度擴散問題，BP算法計算出的梯度随着深度向前而顯著下降，導緻前面網絡參數貢獻很小，更新速度慢。

2023-03-14 18:57:02

深度網絡存在問題:

網絡越深，需要的訓練樣本數越多。若用監督則需大量标注樣本，不然小規模樣本容易造成過拟合（深層網絡意味着特征比較多，機器學習裡面臨多特征：1、多樣本 2、規則化 3、特征選擇）；

多層神經網絡參數優化是個高階非凸優化問題，常收斂較差的局部解；

梯度擴散問題，BP算法計算出的梯度随着深度向前而顯著下降，導緻前面網絡參數貢獻很小，更新速度慢。

解決方法：

逐層貪婪訓練，無監督預訓練（unsupervised pre-training）即訓練網絡的第一個隐藏層，再訓練第二個…最後用這些訓練好的網絡參數值作為整體網絡參數的初始值。

1、無監督學習——->參數初始值；

2、監督學習——->fine-tuning，即訓練有标注樣本。

經過預訓練最終能得到比較好的局部最優解。

fine-tuning對神經網絡權值改變很小，似乎權值被困在某個局部區域。而且第一層改變最少，第二層次之…最後一層最大。

深度網絡存在問題:

網絡越深，需要的訓練樣本數越多。若用監督則需大量标注樣本，不然小規模樣本容易造成過拟合（深層網絡意味着特征比較多，機器學習裡面臨多特征：1、多樣本 2、規則化 3、特征選擇）；

多層神經網絡參數優化是個高階非凸優化問題，常收斂較差的局部解；

梯度擴散問題，BP算法計算出的梯度随着深度向前而顯著下降，導緻前面網絡參數貢獻很小，更新速度慢。

繼續閱讀

Command Network(POJ 3164)---定根最小樹形圖模闆題題目描述輸入格式輸出格式輸入樣例輸出樣例分析源程式

開源低帶寬語音編解碼器

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

C++ 第十五周報告1--《冒泡法排序》

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

Git學習筆記5 merge沖突時二選一

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希