今天聊聊监督。
“监督”是机器学习里一个很重要的概念,像是一座高耸入云的山峰,将机器学习这一门学科分出了两个泾渭分明的门派:有监督学习(supervised learning)和无监督学习(unsupervised learning)。一门机器学习就已经够不容易了,为啥还要硬生生拆成两门——难道是为了多一门挂科多一份快乐?
应该.......不全是,还有点别的。这就要从什么是监督说起。
监督这个词不算太生僻,给人的形象大约就是不近人情的中年人,啤酒肚,地中海,叉着这个手站你后边,面带批判地专等着你犯错好找茬吼你。总之,形象不太好,不过,似乎又确实包含有机器学习里的“监督”的几个要素。
那么,机器学习里的监督到底是什么呢?
直白点说就是对答案。这里包含了两个要素,一是得有一份答案,二是比对。谁和谁比对?模型预测结果和答案比对,二者的差别称为偏差。有答案的机器学习就是有监督学习,而有监督学习的整个过程不干别的,就是不断缩小偏差,这就是机器学习的所谓“学习”,也成为拟合。
而没有答案的那一类机器学习,自然就是无监督学习,自然也将有着截然不同的学习过程。
下次再聊。