如果您正在寻找适合概念和实现核心的机器学习入门,那么这本新的免费教科书将帮助您轻松地学习ML工程。通过关注基础算法的基础,您将快速启动并运行自己构建的代码。
这本书涵盖的内容
本书涵盖了机器学习中最常见方法的基础。这套方法就像机器学习工程师的工具箱。那些进入机器学习领域的人应该对这个工具箱感到满意,因此他们拥有执行各种任务的正确工具。本书的每一章都对应一种机器学习方法或一组方法。换句话说,每一章都专注于ML工具箱中的单个工具。
以我的经验,适应这些方法的最佳方法是从理论上和代码上看到它们都是从头开始的。本书的目的是提供这些推导。每章分为三个部分。概念 部分从 概念上介绍了这些方法,并从数学上推导了它们的结果。该 建筑 节说明了如何构建使用Python从头开始的方法。在 实现 部分演示如何使用包应用方法在Python像scikit学习,statsmodels和tensorflow。
为什么要学这本书
关于机器学习的书籍很多,都是由知识渊博的作者撰写的,涵盖了广泛的主题。特别是,我会建议 简介统计学习, 统计学习的要素,以及 模式识别和机器学习,所有这一切都可以在网上免费。
虽然这些书提供了机器学习及其方法背后的理论的概念概述,但本书着重介绍了机器学习算法的基本知识。其主要目的是为读者提供独立构建这些算法的能力。延续工具箱的类比,本书旨在作为用户指南:其目的不是教用户广泛的本领域实践,而是教每个工具如何在微观层次上工作。
这本书适合谁
本书面向希望学习新的机器学习算法或更深入地了解算法的读者。特别是,本文档供有兴趣阅读从头到尾得出的机器学习算法的读者使用。看到这些推论可能有助于以前不熟悉常见算法的读者理解它们的直观工作方式。或者,看到这些推导可能会帮助有建模经验的读者了解不同的算法如何创建它们所做的模型以及每种算法的优缺点。
这本书对于那些具有基础建模实践的人来说将是最有帮助的。它不审查最佳实践(例如特征工程或平衡响应变量),也不对某些模型比其他模型更合适进行深入讨论。相反,它专注于这些模型的元素。
读者应该知道什么
本书的 概念部分主要需要微积分知识。但是,有些需要理解概率(考虑最大似然和贝叶斯规则)和基本线性代数(考虑矩阵运算和点积)。附录回顾了理解本书所需的 数学 和 概率。概念部分还引用了一些常见的机器学习 方法,这些方法也在附录中进行了介绍。概念部分不需要任何编程知识。
本书的 结构 和 代码 部分使用一些基本的Python。构造部分需要了解相应的内容部分,并且需要熟悉在Python中创建函数和类的过程。代码部分都不需要。
目录
1.普通线性回归
2.线性回归扩展
3.判别分类器(逻辑回归)
4.生成分类器(朴素贝叶斯)
5.决策树
6.集成树方法
7.神经网络
附录
书籍链接:https://dafriedman97.github.io/mlbook/content/introduction.html
随机森林原理介绍与适用情况(综述篇)'建议收藏'