首先,人工智能(Artificial Intelligence)有很多领域:
包括机器学习(Machine Learning)、专家系统、、进化计算、模糊逻辑、计算机视觉、自然语言处理、推荐系统等。
所以机器学习是一种实现人工智能的技术,而另一个深度学习(Deep Learning)是一种实现机器学习的技术。
第一个机器学习的定义来自于 Arthur Samuel。他定义机器学习为,在进行特定编程的情况下,给予计算机学习能力的领域。 Samuel 的定义可以回溯到 50 年代,他编写了一个西洋棋程序。这程序神奇之处在于,编程者自己并不是个下棋高手。但因为他太菜了,于是就通过编程,让西洋棋程序自己跟自己下了上万盘棋。通过观察哪种布局(棋盘位置)会赢,哪种布局会输,久而久之,这西洋棋程序明白了什么是好的布局,什么样是坏的布局。然后就牛逼大发了,程序通过学习后,玩西洋棋的水平超过了 Samuel。这绝对是令人注目的成果。尽管编写者自己是个菜鸟,但因为计算机有着足够的耐心,去下上万盘的棋,没有人有这耐心去下这么多盘棋。通过这些练习,计算机获得无比丰富的经验,于是渐渐成为了比Samuel 更厉害的西洋棋手。上述是个有点不正式的定义,也比较古老。另一个年代近一点的定义,由 Tom Mitchell 提出,来自卡内基梅隆大学, Tom 定义的机器学习是,一个好的学习问题定义如下,他说,一个程序被认为能从经验 E 中学习,解决任务 T,达到性能度量值P,当且仅当,有了经验 E 后,经过 P 评判,程序在处理 T 时的性能有所提升。我认为经验E 就是程序上万次的自我练习的经验而任务 T 就是下棋。性能度量值 P 呢,就是它在与一些新的对手比赛时,赢得比赛的概率。
经验E 任务T 度量值P
最常用的两种算法:监督学习 无监督学习
监督学习:
比如最简单的根据面积推测房价,推测连续值,这是一个回归问题。
而根据肿瘤大小判断是不是良性,两种可能,是,不是, 离散值 ,这是一个分类问题。(离散值可能也不止两个,也有多个)
而有时会根据,肿瘤大小和年龄来判断,这就有了两个特征值,也可能有多个特征值甚至无限多,这时候要用向量机。
而回归和分类都是监督学习,因为我们知道要归纳出的结果。
无监督学习:
经典的例子就是新闻的分类,可能有很多类; 还有多个人的声音的分离,可能有多个人。
共同点是 可能分成很多类,但我们并不知道会有多少类,这就是无监督学习。