天天看点

有监督学习,无监督学习,半监督学习和强化学习

什么是机器学习: 如果计算机程序可以从经验E中学习有关某类任务T和绩效指标P的信息,并且计算机对T中任务的绩效(由P衡量)随经验E的提高而有所提高,那么这个过程就可以被称作是机器学习了.

其实机器学习的过程和人学习的过程很相似,想想高考前我们刷过的那些题,所谓的经验E就是经过不断的刷题让我们不断提高的做题技巧和知识掌握率,通过不断的重复刷题这个动作使经验E增多,为了在最后的任务T中取得好的成绩,也就是更高的绩效指标P,这么解释会不会更容易理解一点.

机器学习的算法分类

主要分成有监督学习,无监督学习,半监督学习和强化学习四类

有监督学习和无监督学习很容易区分和理解,直白来讲,监督的含义就是训练数据集和测试数据集有没有标签:

如果数据集中包含了特征和标签的,是有监督学习,也就是最后的计算结果对不对,是有标准答案可以做参考和对比的;

而数据集中只有特征没有标签的,是无监督学习,也就是最后的结果对不对,是没有标准答案的.

比如做分类的时候,大多数时候是有监督的,就是提前知道了分几类,有哪些特征的数据是属于哪一类的都可以判断出,而做聚类的时候就是无监督的了,不知道应该聚几类才是对的,也不知道哪些数据在哪一类的才是对的.

半监督学习就有点不好理解了,半监督一般是指数据集中的数据有一部分是有标签的,另一部分是没标签的,既不完全符合有监督学习的要求,也不完全符合无监督学习的要求,比如说在图像识别领域,有一堆图片,手工标注出其中含有猫的图片,这样一个数据集就是一部分数据有标签一部分数据没标签,这样一个数据集就可以用用半监督学习的方法对数据集进行训练,使一个模型能够准确从一堆图片中识别出猫.

在半监督学习中,也包含两种学习方法,一种是将没有标签的数据和有标签的数据同等对待进行训练,另一种是将没有标签的数据作为需要被预测的数据对待,两者也是有不同的.

强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。

说起这个强化学习就更厉害了,它的每一步没有明确的标签标识对错,只存在一个最终的结果作为导向,比如说下棋,走的每一步都没有什么对错,毕竟看的是全局,在训练机器的时候,机器也不知道对错,但是机器知道走到最后是输还是赢,如果输了,下次就不这么走了,如果赢了,那就记下这种走法,是可行的.通过不断的"试错"来学习积累,这就是强化学习了.

继续阅读