参考链接: 人工智能的类型
前言: 刚上大学的时候,每每学习一个新的课程,总觉得学习“概论”、“分类”这种东西很无聊。后来发现,学习具体的实现细节才是最无聊的……因为永远 记 不 住。 所以 开始告诉自己建立系统的知识框架才是重要的:
强人工智能 & 弱人工智能:
>> 强人工智能:指能制造出真正地推理和解决问题的智能机器。比如日本动漫里的“阿童木”、钢铁侠的AI管家“贾维斯”就可以说是一个强人工智能。
>> 弱人工智能:只用于解决某些特定领域的问题,比如 AlphaGo,只会下围棋。
目前人工智能的现状是:强人工智能很弱、弱人工智能很强。弱人工智能已经强大到可以替代许多的岗位,深圳法庭已经开始试用智能语音识别做庭审的发言记录,医院可以用图像识别技术做医学影像的分析。而强人工智能,按照某大咖的说法,人类目前最先进的强人工智能,也远远比不上一个三岁孩子的智力。
补充:以笔者个人的理解,目前强人工智能最大的一个问题是——还具备不了真正的推理能力。比如一个数字识别模型,如果使用的训练数据都是正写的“2”,那么当这个模型输入一个倒写的“2”,一般都是识别不出来的。
结构化数据 & 非结构化数据:
所有的信息科学技术,甚至于整个自然科学技术领域,说到底是都是对数据的分析处理。在人工智能研究中,按所研究对象的数据类型的不同,可以分为:结构化数据、非结构化数据
>> 结构化数据:气温(36 C)、相对温度(75%)、降水量(10mm),以上一组数据则可称为结构化数据,即每一个维度(属性)已经被清晰的量化。
>> 非结构化数据:像一幅图像、一段语音、一段视频,这些都称为非结构化数据。
那么我们怎么让电脑处理非结构化数据的呢?说白了,只有华山一条山——先把非结构化数据转化成结构化数据。比如一张有480个像素点的图片,我们先把它转化为有480维度的结构化数据,再进行进一步处理。再说白了,其实“气温”、“相对温度”本来也是非结构化数据,只是有人在程度员之前帮忙做了量化。
回归预测 & 分类预测
再再说白了,现在人工智能所完成的很多工作,就是通过数据分析做出最合理的预测,由预测的输出类型,可以分为: 回归预测、分类预测、聚类预测
>> 回归预测:预测数据为连续性数据。定量输出,连续变量预测。比如:预测第二天的股价是多少(契合国情,可能应该预测跌多少)
>> 分类预测:预测数据为类别型数据,并且类别已知。定性输出,定性输出。比如:预测第二天的股价是涨是跌(契合国情,可能应该预测跌不跌停)
>> 聚类预测:预测数据为类别型数据,但类别未知。
机器学习:
“人工智能的核心,是使计算机具有智能的根本途径。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。” (以上定义来自百度百科)
监督学习&无监督学习
>> 监督学习
给程序一堆打好标签的数据,比如:有1000张猫的图片(“猫”作为这些图片的标签),和1000张没猫的图片(“没猫”作为这些图片的标签)。通过输入这2000张图片作为程序的训练数据,从而让程序学会识别图片中有无猫,这一过程称为“监督学习”
>> 无监督学习
不需要任何带标签的训练样本,而需要直接对数据进行建模。 无监督学习里典型的例子就是聚类了,“啤酒&尿布”是最典型的一个案例: 通过对超市销售数据的分析,得到啤酒跟尿布的销售有很强的相关性。
(本文中涉及到定义及引例可能存在争议,只作为个人的小见解,后续会继续完善本文)