1機器學習的一些概念
模型Y(預測)=F(X|θ)
機器學習是調整參數θ的過程
Y(實際)已标定為監督學習
Y(實際)自我生成為無監督學習
泛化能力為模型用于新樣例的能力
過拟合:學習過好,學習了樣本的獨有的屬性
防止過拟合,對過拟合的回歸函數進行正則化的函數j(f),使經驗風險和結構風險達到平衡的函數
欠拟合:學習不夠好,有些屬性沒有學習到
2線性回歸原理
利用數理統計中的回歸分析,來确定兩種或兩種以上變量間,互相依賴的定量關系的一種統計分析方法
3線性回歸損失函數、代價函數、目标函數
L=21i=1∑n(yi−wTxi−b)2
4優化方法(梯度下降法、牛頓法、拟牛頓法等)
5線性回歸的評估名額
①皮爾遜相關系數:衡量線性相關強弱的名額
當相關系數越接近1或者-1時,表示其相關性越高。
缺點:受樣本量影響較大
②均方根誤差RMSE:
③平均絕對誤差MAE
6sklearn參數詳解
調用sklearn.linear_model.LinearRegression()所需參數:
fit_intercept : 布爾型參數,表示是否計算該模型截距。可選參數。
normalize : 布爾型參數,若為True,則X在回歸前進行歸一化。可選參數。預設值為False。
copy_X : 布爾型參數,若為True,則X将被複制;否則将被覆寫。 可選參數。預設值為True。