【导读】春节将近,在亲友相聚之余也不忘给自己充充电。为此,专知内容组给大家带来了台大李宏毅老师的2017年机器学习课程系列学习笔记。今天我们先来看一下该系列课程的内容简介。从本质上来讲,机器学习可以分为三部分:函数集(也就是model)、评价函数好坏的标准、训练集。该课程中机器学习的大致内容包括:有监督学习、无监督学习、半监督学习、回归、分类、迁移学习、结构化学习、强化学习。今天我们就来总览一下这些技术,并在后续的更新中跟大家一一介绍。
课件网址:
http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML17_2.html
视频网址:
https://www.bilibili.com/video/av15889450/index_1.html
李宏毅机器学习笔记- Introduction
人工智能目前是非常热门的技术,人工智能在20世纪50年代已经出现,机器学习在20世纪80年代兴起,深度学习最近才火起来,其中人工智能是目标,机器学习是手段,深度学习是机器学习的一部分。
传统的计算机程序可以理解为人类设定好的天生本能,但它永远不会超过创造者
而机器学习则能够从已有的知识中学习到新的知识
其本质是从数据集中学习到一个函数,当你给这个函数一个输入,它就会有一个输出,这个输出就是人类想要的答案。函数f特别复杂,不可能通过人类推算出来,需要机器来学习
机器学习可以简单分为三个部分,第一个是函数集,也称为model,第二个为评价函数好坏的标准,用来选出最好的函数,第三个为训练集,帮助训练想要的函数。
所学习到的函数应该有举一反三的能力,即使训练集中没出现的东西,例如猫的图片,函数也应该给出一个结果。
机器学习的大体框架如下:
Supervised learning中的task和method在其他scenario也同样存在
supervised learning即监督学习,其典型特征为数据集有其标签,例如猫的图片标记着猫,狗的图片标记着狗。
regression即回归,从以往数据中总结经验,输出一个数值,一般用于预测任务,例如pm2.5的预测
Classification
classification即分类,分为binary classification和multi-class classification。Binary classification根据输入判断yes或者no,而multi-class classification相当于选择题,从多个类别选出一个答案
binary classification的典型例子为垃圾邮件的分类
multi-class classification的例子为文档分类
以上Supervised learning需要许多数据,我们可以采用别的方法减少数据量
Semi-supervised learning
半监督学习中,有许多没有label的数据集,这些没有label数据集对训练很有帮助
Transfer learning
迁移学习讲的一堆不相关的有label或者没label的图片,怎么对训练产生作用。例如炮姐(御坂美琴)的图片对于猫和狗的识别系统肯定不相关
Unsupervised learning
无监督学习中的数据集都没有标签,相当于无师自通,只有input,没有output
例如机器可以浏览很多动物图片后然后自己画出一个新的动物图片(当然可能图片很奇怪)
Structured learning
Structured learning典型特点是输出有结构性的东西
Regression classification了解的是这个世界,structured learning学习的是世界外的暗黑大陆,有很多问题人们没有探究
Reinforcement learning
增强学习典型特征是从评价中学习,并不告诉机器怎么做,而是告诉机器这样做的对不对
典型的应用就是alpha go
最后总结一下机器学习大体框架
后台回复“LHY2017” 就可以获取 2017年李宏毅中文机器学习课程下载链接~
-END-