概念
- wiki:监督学习是机器学习的一种方法,可以由训练资料中学到或建立一个模式(函数/learning model),并且依次模式推测出新的实例。
- 训练资料:由输入物件和预期输出组成,函数的输出可以是一个连续的值(回归分析),或是预测一个分类标签(分类)
- 通俗讲:我本不知道X 和 Y 能得倒一个什么样的关系,但是通过很多个X和Y且已知XY的关系的数据得知,他们存在一种函数式关系f(x,y)。并且在后续可以通过f(x,y)得到一个符合实际规律(相对准确)的结果。其中在得出规律的这一个过程就叫做监督学习。
监督学习的步骤
- 我们可以根据上面的步骤是不是可以联想几个实际的案例呢?
- 我们在使用外卖,或者买东西的时候我们的快递的预估到达时间是如何来的呢?
- 我们思考一下,让我们自己去算怎么算呢?通过速度和距离呗,但是路是有很多条的,还有天气原因,交通规则等等,实在是因素太多了,那我们可以这样,通过得到监督学习来预估这个达到时间。
- 首先选择一个数学模型,然后将大量已知的数据快递订单时间到收货时间进行保留,还有发货地点和送达的地点。将这些数据给机器,然后让他去发现这个“方法论(函数)”,一旦学习到一定量,那我们就可以进行预测了,当客户点开商品或者下单完我们都能给到客户一个相对准确的时间。(自己的一个简单猜想)
监督学习的2个任务:回归、分类
1. 回归
- 回归方法是一种对数值型连续随机变量进行预测和建模的监督学习算法。使用案例一般包括房价预测、股票走势或测试成绩等连续变化的案例。
- 回归任务的特点是标注的数据集具有数值型的目标变量。也就是说,每一个观察样本都有一个数值型的标注真值以监督算法。
2.分类
分类方法是一种对离散型随机变量建模或预测的监督学习算法。使用案例包括邮件过滤、金融欺诈和预测雇员异动等输出为类别的任务。
许多回归算法都有与其相对应的分类算法,分类算法通常适用于预测一个类别(或类别的概率)而不是连续的数值。
参考
https://zh.wikipedia.org/wiki/监督学习 https://www.jiqizhixin.com/articles/2017-05-20-3 https://easyai.tech/ai-definition/supervised-learning/