天天看点

《Python机器学习——预测分析核心算法》——第1章 关于预测的两类核心算法

本节书摘来异步社区《python机器学习——预测分析核心算法》一书中的第1章,作者:【美】michael bowles(鲍尔斯),更多章节内容可以访问云栖社区“异步社区”公众号查看。

python机器学习——预测分析核心算法

本书集中于机器学习领域,只关注那些最有效和获得广泛使用的算法。不会提供关于机器学习技术领域的全面综述。这种全面性的综述往往会提供太多的算法,但是这些算法并没有在从业者中获得积极的应用。

本书涉及的机器学习问题通常是指“函数逼近(function approximation)”问题。函数逼近问题是有监督学习(supervised learning)问题的一个子集。线性回归和逻辑回归是解决此类函数逼近问题最常见的算法。函数逼近问题包含了各种领域中的分类问题和回归问题,如文本分类、搜索响应、广告放置、垃圾邮件过滤、用户行为预测、诊断等。这个列表几乎可以一直列下去。

从广义上说,本书涵盖了解决函数逼近问题的两类算法:惩罚线性回归和集成方法。本章将介绍这些算法,概述它们的特性,回顾算法性能对比研究的结果,以证明这些算法始终如一的高性能。

然后本章讨论了构建预测模型的过程,描述了这里介绍的算法可以解决的问题类型,以及如何灵活地构建问题模型,选择用于做预测的特征。本章也描述了应用算法的具体步骤,包括预测模型的构建、面向部署的性能评估等。