2019最新实战！给程序员的7节深度学习必修课，最好还会Python！

整理 | 琥珀

出品 | AI科技大本营

从 2017 年开始，fast.ai 创始人、数据科学家 Jeremy Howard 以每年一迭代的方式更新“针对编程者的深度学习课程”（Practical Deep Learning For Coders）。这场免费的课程可以教大家如何搭建最前沿的模型、了解深度学习的基础知识。直到今年已经是第三个年头了。

1 月 24 日，fast.ai 上线 2019 版深度学习新课程。据介绍，该课程 100% 全新，包括以前从未涵盖过的深度学习入门课程，甚至其中某些技术成果还尚未发表学术论文。

如以往一样，Jeremy Howard 公开了本次课程将涵盖的所有细节内容。他表示，本次课程共有七节，每节课大约 2 小时，当然，预计完成课后作业的时间将有 10 小时。

课程将涉及的应用案例

本次课程设计关键应用包括：

计算机视觉（例如按品种分类宠物照片）
图像分类
图像定位（分割和激活图）
图像关键点
NLP（如电影评论情绪分析）
语言建模
文档分类
表格数据（如销售预测）
分类数据
连续数据
协作过滤（如电影推荐）

课程涵盖的基础

课程链接传送：https://course.fast.ai 目标人群：至少有一年的编程经验，且最好是 Python，fast.ai 还提供了Python 相关的学习资源。

第 1 课：图像分类

该系列课程第一课，是训练一个能以最高精准度识别宠物品种的图像分类器。其中，迁移学习的使用时本次课程的基础。我们将了解如何分析模型，以了解其失效模型，或许还能发现，模型出错的地方与育种专家犯了相同的错误。

训练和分析宠物品种分类器

我们将讨论课程的整体方法，这与先理论再实际应用的方式不同，课程旨在先进行实际应用再深入研究。

我们还将讨论如何在训练神经网络时设置最重要的超参数：学习率（这主要基于 Leslie Smith 的 learning rate finder）。最后，还会介绍“标签”的问题，并了解 fast.ai 所提供的功能，如可以轻松将标签添加到图像中。

第 2 课：数据清洗与构建；梯度下降法（SGD）

本节课程将学习如何使用自己的数据构建图像分类模型，主要包括以下几方面：

图像收集
并行下载
创建验证集
数据清洗，通过模型找到数据问题

如下图所示，我们可以创建一个可区分泰迪熊和灰熊任务的模型。

将模型投入生产

课程后半部分，将完整训练一个较为简单的模型，同时创建一个梯度下降循环。（注：在此过程中，将学习到很多新的术语，所以请确保做好笔记，因为在整个课程中都会引用这个新术语。）

第3课：数据块；多标签分类；分割

本节课开始将主要研究一个有趣的数据集，叫做 “Planet’s Understanding the Amazon from Space”。为了将这些数据转化为模型需要的形式，将使用 fast.ai 工具之一的数据块 API。

Planet 数据集的一个重要特征是，它是一个多标签数据集。也就是说，每个Planet 图像可包含多个标签，而之前看过的数据集，每个图像只有一个标签。此外，可能还需要对多标签数据集进行修改。

图像分割模型的结果

接下来的图像分割，是一个标记图像中每个像素的过程，其中一个类别显示该像素描绘的对象类型。将使用与早期图像分类类似的技术，所以不需要太多调整。

本课程中还会使用到 CamVid 数据集，该模型误差远低于在学术文献中找到的任何模型。

假设：如果你的因变量是连续值而不是类别怎么办？我们将重点回答这个问题，查看关键点数据集，并构建一个精准预测面部关键点的模型。

第 4 课：NLP；表格数据；协同过滤；嵌入（Embeddings）

使用 IMDb 电影评论数据集深入研究自然语言处理（NLP）。在这项任务中，目标是预测电影评论是积极的还是消极的，这称为“情绪分析”。此前，在 fast.ai 2018 课程里提到的 ULMFit 算法，对 NLP 的发展起着重要作用。纽约时报曾报道：“新系统开始瓦解自然语言的代码。”ULMFiT 被认为是当今最准确的情绪分析算法。