本周,我们为您带来Trevor Hastie,Robert Tibshirani和Jerome Friedman撰写的《统计学习的要素》。该统计(和机器)学习领域的开创性著作的第一版最初于近20年前出版,并迅速巩固了自身地位,成为该领域的领先著作之一。然而,在过去的几年中,统计学习的要素并没有保持一成不变,因此该书的第二版于2009年出版。这是我们今天讨论的第二版,尤其是2017年的第12版。
首先,为什么要进行“统计学习”?如果您不知道该术语,或者以前只听说过该术语在本书的标题中使用过,则不用担心。这不是一个与您当前正在学习或感兴趣的领域截然不同的研究领域。本书网站上的以下引语可以帮助您正确理解该术语(添加了重点):
在过去的十年中,计算和信息技术呈爆炸式增长。随之而来的是许多领域的大量数据,例如医学,生物学,金融和市场营销。理解这些数据的挑战导致了统计领域中新工具的开发,并催生了新领域,例如数据挖掘,机器学习和生物信息学。
作者继续简明地解释“学习”的概念及其重要性:
这本书是关于从数据中学习。在典型情况下,我们希望根据一组功能(例如饮食和临床)对结果进行度量,通常是定量的(例如股票价格)或分类的(例如心脏病发作/没有心脏病发作)测量)。我们有一组训练的数据,其中我们观察了一组对象(例如人)的结果和特征度量。使用这些数据,我们可以建立一个预测模型或学习者,这将使我们能够预测看不见的新物体的结果。一个好的学习者可以准确地预测这样的结果。
统计学习的要素实际上是关于在统计领域将新工具应用于学习过程并建立良好的学习模型的。
该书内容详尽,涵盖了您希望该书涵盖的所有内容。目录如下。
介绍
- 监督学习概述
- 线性回归方法
- 线性分类方法
- 基础扩展和正则化
- 内核平滑方法
- 模型评估与选择
- 模型推断和平均
- 可加模型,树和相关方法
- 助推树和加性树
- 神经网络
- 支持向量机和灵活判别
- 原型方法和最近邻
- 无监督学习
- 随机森林
- 合奏学习
- 无向图形模型
- 高维问题
每章均着重于重要性统计学习的特定方面。例如,模型评估和选择被认为是一个概念的重要程度,因此可以授予其自己的章节,既恰当又令人耳目一新。在介绍了几章有关建模技术的章节之后,本章还早就出现了,这一点也值得注意。在引入了一系列分类技术之后,将这一章改写为一章可能意味着读者从未接触过它,他们可能已经感觉到,他们在学习算法后已经从书中获得了所需的一切,这是真正的错误。
这就是说,作为作者兼研究人员和指导者的作者,有一种方法来表达自己的专业知识。他们的方法似乎遵循逻辑上有序的方法,以了解读者应在何时何地进行学习。但是,各个章节也可以独立存在,因此,只要您已经对本书的内容有所了解,那么拿起本书直接进入有关模型推论的章节就可以很好地工作。它。
这些年来,这本书的评论很多,而且总体上是正面的。严格的评论往往集中在几个特定的问题上:这本书是为那些对统计学有高级理解的人而写的,而这本书是以混乱的或不友好的方式呈现的。该书的简介解释了:
本书专为统计,人工智能,工程,金融等众多领域的研究人员和学生设计。我们希望读者将至少有一门统计学的基础课程,涵盖线性回归等基本主题。
因此,上述问题并非不可克服。这本书之所以广受赞誉是有原因的,并且通过花时间与人相处,即使是初学者,您也可以多年来获得其他人的相同奖励。但请注意,这本超过750页的书并非随意阅读;您需要投入时间。
后台私信“统计学习基础”即可获取PDF版下载链接。