无监督学习
1.与监督学习区别:所用数据集无标记信息(or无正确答案)。
2.聚类算法:将所有数据信息分成若干组,每组称为一个“簇”。
3.无监督学习与聚类算法应用:新闻分类、人际关系分析、天文数据分析。
4.鸡尾酒会算法:音频分离
5.问:以下哪一个为无监督学习问题?
- 通过学习判断邮件是否为垃圾邮件
- 给你很多新闻文章,通过学习将其分类
- 给你一个关于客户信息的数据集,将其分析分类到对应市场的潜在客户(市场细分)。
-
给出特定特征,学习判断是否患有糖尿病
答
6.总结
根据训练数据是否有标记信息将学习任务分为:“监督学习”、“无监督学习”。监督学习中的代表为分类与回归,它们是根据我们欲预测值是离散值与连续值区分的。聚类为后者的代表。