天天看點

task1

1機器學習的一些概念

模型Y(預測)=F(X|θ)

機器學習是調整參數θ的過程

Y(實際)已标定為監督學習

Y(實際)自我生成為無監督學習

泛化能力為模型用于新樣例的能力

過拟合:學習過好,學習了樣本的獨有的屬性

防止過拟合,對過拟合的回歸函數進行正則化的函數j(f),使經驗風險和結構風險達到平衡的函數

欠拟合:學習不夠好,有些屬性沒有學習到

2線性回歸原理

利用數理統計中的回歸分析,來确定兩種或兩種以上變量間,互相依賴的定量關系的一種統計分析方法

3線性回歸損失函數、代價函數、目标函數

L=21​i=1∑n​(yi​−wTxi​−b)2

4優化方法(梯度下降法、牛頓法、拟牛頓法等)

task1
task1
task1
task1

5線性回歸的評估名額

①皮爾遜相關系數:衡量線性相關強弱的名額

當相關系數越接近1或者-1時,表示其相關性越高。

缺點:受樣本量影響較大

②均方根誤差RMSE:

③平均絕對誤差MAE

6sklearn參數詳解

調用sklearn.linear_model.LinearRegression()所需參數:

fit_intercept : 布爾型參數,表示是否計算該模型截距。可選參數。

normalize : 布爾型參數,若為True,則X在回歸前進行歸一化。可選參數。預設值為False。

copy_X : 布爾型參數,若為True,則X将被複制;否則将被覆寫。 可選參數。預設值為True。