【MachineLearning】之 LASSO 回归

2022-10-21 15:51:56

Topic:

LASSO 回归的几何意义

LASSO 代码

LASSO 的 L1 正则项与岭回归的 L2

一、LASSO回归的几何意义

与岭回归相似，LASSO 回归优化的目标函数也等价于：

FLASSO=∥y−Xw∥22

‖

−

‖

s.t.∥w∥1⩽t(1)

(1)

‖

⩽

其中，t

是 λλ 对于的一个常数，这里通过限制 ∥w∥1

‖

的大小来避免过拟合的发生。所以，假设我们有 2 个变量, 残差平方和 (y1−wT1x)2+(y2−wT2x)2

(

−

)

(

−

)

当抛物面受到 ∥w1∥1+∥w2∥1≤t

‖

≤

二、LASSO 代码

LASSO 回归通过添加正则项来改进普通的最小二乘法，这里添加的是 L1

FLASSO=∥y−Xw∥22+λ∥w∥1(2)

(2)

‖

−

‖

同样通过

scikit-learn

提供的 LASSO 回归方法

Lasso()

来进行数据拟合。

sklearn.linear_model.Lasso(alpha=1.0, fit_intercept=True, normalize=False, precompute=False, 
copy_X=True, max_iter=1000, tol=0.0001, warm_start=False, positive=False, random_state=None, selection='cyclic')

alpha : 正则化强度，默认为 1.0。
fit_intercept : 默认为 True，计算截距项。
normalize : 默认为 False，不针对数据进行标准化处理。
precompute : 是否使用预先计算的 Gram 矩阵来加速计算。
copy_X : 默认为 True，即使用数据的副本进行操作，防止影响原数据。
max_iter : 最大迭代次数，默认为 1000。
tol : 数据解算精度。
warm_start : 重用先前调用的解决方案以适合初始化。
positive : 强制系数为正值。
random_state : 随机数发生器。
selection : 每次迭代都会更新一个随机系数。

"""使用 LASSO 回归拟合并绘图
"""
from sklearn.linear_model import Lasso

alphas = np.linspace(-2,2,10)
lasso_coefs = []

for a in alphas:
    lasso = Lasso(alpha=a, fit_intercept=False)
    lasso.fit(x, y)
    lasso_coefs.append(lasso.coef_)

plt.plot(alphas, lasso_coefs) # 绘制不同 alpha 参数下的 w 拟合值
plt.scatter(np.linspace(0,0,10), parameters[0]) # 普通最小二乘法拟合的 w 值放入图中
plt.xlabel('alpha')
plt.ylabel('w')
plt.title('Lasso Regression')

【MachineLearning】之 LASSO 回归

一、LASSO回归的几何意义

二、LASSO 代码

三、LASSO 的正则项与岭回归的有什么不同？

继续阅读

【分类算法】什么是分类算法定义分类与聚类分类过程方法

分类算法的评价指标

K-近邻算法以及图像分类应用

weka之NB算法

使用weka的select attribute

weka中分类器算法

在weka中集成自己的算法

【多变量线性回归】学习记录序思路实现终

申请评分模型拒绝推断（RI）方法申请评分模型拒绝推断（RI）方法

【人工智能行业大师访谈1】吴恩达采访 Geoffery Hinton

【趋高机器视觉】机器视觉技术原理解析及解决方案

吴恩达 coursera ML 第七课总结+作业答案前言目录正文模型表示作业答案

XGBoost Plotting API以及GBDT组合特征实践 XGBoost Plotting API以及GBDT组合特征实践

解码器用于语义分割：数据依赖的解码可以实现灵活的特征聚合

2021-2025年中国运动疗法（KT）带行业市场供需与战略研究报告

详解STM32单片机的堆栈

【MachineLearning】之 LASSO 回归

一、LASSO回归的几何意义

二、LASSO 代码

三、LASSO 的 正则项 与 岭回归 的 有什么不同？

继续阅读

三、LASSO 的正则项与岭回归的有什么不同？