吴恩达机器学习笔记4-有监督学习

2020-08-14 10:08:21 浏览数 (1)

本次视频讲解什么是有监督学习,重点讲了回归问题、分类问题。

01

视频

02

笔记

本次视频,吴老师通过两个例子给我们讲解了什么是有监督的机器学习。这里面又包括了有监督学习常被用来解决的两类问题:回归问题、分类问题。

2.1 什么是有监督的机器学习?

在本视频中,吴老师并没有给出监督学习的非常学术化的定义。他通过两个例子来引导我们认识监督学习。

假设你手上有这样一些数据,如下面图所示。你知道了一些已经卖出去的房子的面积和价格,然后给你一个新的房子让你预测一下它的售价,像这样由一组已知了自变量(房屋面积)、因变量(房屋售价)的数据让你去预测新的自变量对应的因变量的学习问题,就叫做有监督学习。

2.2 回归问题

那什么是回归问题呢?还是以上面卖房子的问题为例,我们房子售价的可能取值是连续的,这类监督学习问题就叫做回归问题。

如下面的图,我们可以用直线或者曲线去拟合已知的房价和面积之间的关系,又分别被称为线性回归和非线性回归。

2.3 分类问题

另一类监督学习问题是分类问题,相对于回归问题,它的因变量取值是离散的值,即因变量所有可能取值是有限。

比如下图对于肿瘤大小和肿瘤类型的关系的学习问题。给定一个肿瘤尺寸我们对它进行预测,它要么是良性的、要么是恶性的,就只有这两种可能性。这样的问题就是分类问题。

当然,在实际的问题中,我们要考虑的自变量可能有很多很多,肿瘤这种我们可能还要考虑患者的年龄、肿瘤的厚度等,最后对肿瘤类型的分类可能也不止两种。

最后,给了给了一个练习题。有两个机器学习任务:

  1. 假设有一个商品,存量挺大的,让你预测接下来3个月将会卖掉多少。
  2. 假设你开发了一个款软件有很多用户,让你判断每个用户是不是被黑客攻击了。

很显然,第1个问题是回归问题、第2个问题是分类问题。

0 人点赞