5分钟理解人工智能与机器学习的区别

2018-09-21 10:12:26 浏览数 (1)

人工智能不是一个新名词,它已有数十年历史。从80年代初开始,计算机科学家设计了能够学习和模仿人类行为的算法。

在学习方面,最重要的算法是神经网络,由于过度拟合它不是很成功(模型强大但是数据不足)。然而,在一些更具体的任务中,使用数据来适应一个功能的想法已经取得了显著的成功,这是今天机器学习的基础。

在模拟方面,人工智能专注于图像识别、语音识别和自然语言处理等方面。专家们花费了大量的时间来创建诸如边缘检测、颜色配置文件、N-gram、语法树等功能。

传统机器学习

机器学习(MachineLearning,ML)技术在预测中发挥了重要作用,而ML经历了几代的发展才有了一套丰富的模型结构,例如:

· 线性回归

· 逻辑回归

· 决策树

· 支持向量机

· 贝叶斯模型

· 正则化模型

· 集合模型

· 神经网络

这些预测模型中的每一个都是基于一定的算法结构,参数为可调旋钮。训练预测模型包括以下步骤:

1. 选择模型结构(如逻辑回归、随机森林等)。

2. 用训练数据(输入和输出)为模型提供信息。

3. 学习算法将输出最优模型(即具有最小训练误差的特定参数的模型)。

每个模型都有自己的特点,在某些任务中表现良好,在另一些任务中表现不好。但一般情况下,我们可以将它们分为低功耗/简单模型和高功耗/复杂模型。在不同型号之间进行选择是一个非常棘手的问题。

传统上,使用简单模型比使用复杂模型更可取,原因如下:

· 在我们拥有巨大的处理能力之前,训练复杂模型将花费很长的时间。

· 除非我们有大量的数据,否则训练复杂模型会导致过拟合问题。

然而,选择低功耗模型存在所谓的“不匹配”的问题,即模型结构过于简单,无法适应更复杂的训练数据。(假设底层数据具有二次关系:y=5*x^2;无论我们选择什么a和b,都不可能拟合线性回归:y=a*x b。)

为了缓解“不匹配”的问题,数据科学家通常会应用他们的“领域知识”来提出“输入特征”,这与输出有更直接的关系。(例如,回到y=5*square(X)的二次关系,如果创建一个特性z=x^2,则可以通过选择a=5和b=0来拟合线性回归:y=a*z b。)

机器学习的一个主要障碍是这一特征工程步骤,它要求领域专家在输入训练过程之前识别重要的信号。特征工程步骤非常手动,需要大量的专业知识,因此成为当今大多数机器学习任务的主要瓶颈。

换句话说,如果我们没有足够的处理能力和足够的数据,那么我们必须使用低功耗/更简单的模型,这需要我们花费大量的时间和精力来创建适当的输入特性。这是大多数数据科学家今天花时间做的事情。

返回神经网络

在21世纪初,随着云计算和大规模并行处理基础设施的发展,机器处理能力大大提高,在大数据时代,大量的细粒度事件数据被收集起来。我们不再局限于低功耗/简单模式。例如,当今最流行的两种主流机器学习模型是随机森林和梯度增强树。然而,尽管两者都非常强大,并且提供了适合训练数据的非线性模型,但数据科学家仍然需要仔细地创建特征,以获得良好的性能。

与此同时,计算机科学家重新使用神经网络的许多层来完成这些人类模拟任务。这给深度神经网络(DNN)带来了新的发展,为图像分类和语音识别任务提供了重要的突破。DNN的主要区别在于,你可以直接将原始信号(例如,RGB像素值)输入DNN,而无需创建任何特定于域的输入特性。通过许多层的神经元(这就是为什么它被称为“深度”神经网络),DNN可以“自动”地通过每一层生成适当的特征,并最终提供一个非常好的预测。这大大节省了“特性工程”的工作,这是数据科学家所做的一个主要瓶颈。

DNN也演化成许多不同的网络拓扑结构,因此我们有CNN(卷积神经网络)、RNN(递归神经网络)、LSTM(长短时记忆)、GAN(生成对抗性网络)、迁移学习、注意力模型等。整个频谱被称为深度学习,它正在引起整个机器学习社区的关注。

强化学习

另一个关键的组成部分是如何模仿一个人(或动物)学习。想象一下感知/行动/奖励循环中的非常自然的动物行为。一个人或动物首先会通过感知他或她所处的“状态”来了解环境。基于此,他或她将选择一个“行动”,将他或她带到另一个“状态”。然后他或她将得到一个“奖励”。循环不断,直到他或她死去。这种学习方式(称为强化学习)与传统的有监督机器学习的曲线拟合方法有很大的不同。特别是,强化学习的发生非常快,因为每一个新的反馈(例如执行一个行动和得到一个奖励)被立即发送,以影响后续的决定。强化学习在自动驾驶汽车和Alphago(一种下棋机器人)方面取得了巨大的成功。

强化学习还提供了预测和优化的平滑集成,因为它在采取不同的行动时,保持了对当前状态和可能的转换概率的信念,然后做出能够导致最佳结果的决策。

深度学习 强化学习=AI

与经典的ML技术相比,DL提供了一个更强大的预测模型,通常可以产生良好的预测效果。与经典的优化模型相比,强化学习提供了一种更快的学习机制,也更能适应环境的变化。

原文标题《How AI Differs From ML》

作者:Ricky Ho

译者:lemon

不代表云加社区观点,更多详情请查看原文链接

0 人点赞