稀疏指的是參數或者資料中零的個數,零的個數越多,參數或者資料就越稀疏.這種稀疏性帶來許多優點.
參數稀疏有什麼好處
1)特征選擇(Feature Selection): 大家對稀疏規則化趨之若鹜的一個關鍵原因在于它能實作特征的自動選擇。一般來說,的大部分元素(也就是特征)都是和最終的輸出yi沒有關系或者不提供任何資訊的,在最小化目标函數的時候考慮xi這些額外的特征,雖然可以獲得更小的訓練誤差,但在預測新的樣本時,這些沒用的資訊反而會被考慮,進而幹擾了對正确yi的預測。稀疏規則化算子的引入就是為了完成特征自動選擇的光榮使命,它會學習地去掉這些沒有資訊的特征,也就是把這些特征對應的權重置為0。
稀疏性優點總結
- 大多數問題線性可分,學習任務的難度有所減低;
- 易于存儲,資料中零的個數多時,可以使用算法減少存儲空間;
- 可解釋性提高.