机器学习-感知机

2023-07-02 10:28:21

感知机

感知机是一个二分类的线性分类模型，输入是特征向量，输出是类别，通常取值为+1和-1。感知机是神经网络和支持向量机的基础。

定义

数学公定义为： f ( x ) = s i n g n ( w x + b ) f(x)=singn(wx+b) f(x)=singn(wx+b)，称之为感知机。其中w和b为感知机模型参数，w为权重，b为偏置。而 s i g n ( ) sign() sign()为符号函数，输出值为+1和-1。

几何解释

我们将其线性方程： w x + b = 0 wx+b=0 wx+b=0，对应于一个超平面上。将其中的w看成超平面的法向量（定义了法向量，那么平面的方向就确定了），b看成是超平面的截距（定义了截距，平面的位置就确定了）。那么，就有如下图所示：

机器学习-感知机

从图中，可以看出平面将空间分为两部分，一部分可以认为是正类，一部分为负类。如果给定一个数据集，存在一个超平面使得正类和负类的点完全正确的被分到超平面的两侧，我们就称此数据集是线性可分的，否则，就称线性不可分。

感知机学习策略

假设数据集是线性可分的，为了能够找到一个合适的超平面，这就需要一个学习策略来确定模型的参数w和b。

我们自然会想到误分类的点越少越好，但是依据这样的损失函数不是连续可导的，无法优化，所以换个思想，改成计算误分类点到超平面的距离。

其中，距离的公式定义为： 1 ∣ ∣ w ∣ ∣ ∣ w x + b ∣ \frac{1}{||w||}|wx+b| ∣∣w∣∣1∣wx+b∣，

机器学习-感知机

由于增加了负号和y的缘故，保持了损失函数是非负的，所以看出误分类点越少，误分类点离超平面越近，损失函数的值越小。我们最终的优化目标是： m i n L ( w , b ) = − ∑ y i ( w x i + b ) minL(w,b)=-\sum{y_i(wx_i+b)} minL(w,b)=−∑yi(wxi+b)。

感知机学习算法的原始形式

机器学习-感知机

这个算法的思想是：每当一个点被误分类，则调整w和b的值，使得分离超平面向误分类点的一侧移动，以减少距离，直至所有的点被正确分类。

有定理可以证明，当数据集线性可分时，经过有限次的搜索，可以找到将训练集数据完全分离的超平面，感知机的原始形式的算法是收敛的。

机器学习-感知机

感知机

定义

几何解释

感知机学习策略

感知机学习算法的原始形式

继续阅读

简单文档分类——朴素贝叶斯算法朴素贝叶斯算法简单文档分类实例步骤总结朴素贝叶斯分类调用(sklearn)

【分类算法】什么是分类算法定义分类与聚类分类过程方法

分类算法的评价指标

K-近邻算法以及图像分类应用

weka之NB算法

使用weka的select attribute

weka中分类器算法

在weka中集成自己的算法

【多变量线性回归】学习记录序思路实现终

申请评分模型拒绝推断（RI）方法申请评分模型拒绝推断（RI）方法

【人工智能行业大师访谈1】吴恩达采访 Geoffery Hinton

【趋高机器视觉】机器视觉技术原理解析及解决方案

吴恩达 coursera ML 第七课总结+作业答案前言目录正文模型表示作业答案

XGBoost Plotting API以及GBDT组合特征实践 XGBoost Plotting API以及GBDT组合特征实践

解码器用于语义分割：数据依赖的解码可以实现灵活的特征聚合

2021-2025年中国运动疗法（KT）带行业市场供需与战略研究报告