AI、ML和DL的区别
最近几年人工智能这个词很火,在百度的搜索词条上居高不下,电影中的那些硬核高科技也逐渐出现在我们身边。但是什么是人工智能呢?
要搞清楚这个问题,就得先理解人工智能(Artificial Intelligence)、机器学习(Machine Learning)、深度学习(Deep Learning)这三个词。
人工智能
人工智能这个词早在1956就被人提出,旨在用当时的计算机来构建复杂的,并且拥有人类智慧特征的机器。之后的几十年,对待人工智能分为两种态度,一是认为这是人类文明发展的未来,另一派认为这是技术疯子的狂想。
直到2012年,随着数据量的剧增,机器学习和深度学习的出现,人工智能出现了前所未有的发展,研究的领域也不断的扩大,包括但不限于:机器学习、推荐系统、模糊逻辑、进化计算等。
人工智能按照能力可以分为弱人工智能和强人工智能,弱人工智能是让机器具备观察和感知能力,可以做到一定程度的理解和推理,例如人脸识别、车辆识别;强人工智能是让机器能够获取自适应能力,能自动处理一起没偶遇遇到过的问题,就像电影中描绘的人工智能。
要在人工智能方向有突破,就得依赖机器学习。
机器学习
机器学习是人工智能的一个分支,它的主要目的是“训练机器”,按照指定的步骤向系统输入大量数据信息,这些能够被系统算法不断学习,并不断积累经验实有效的决策和预测。
下图便是决策树算法的一个简单示例,判断一个瓜的好与坏,决定在该父节点中要以哪个维度向下生成子树。
在我们生活周边游很多机器学习算法的应用,除了上面提及的人脸识别,还有指纹识别,监控物体检测等,这些应用都非常成熟,但是要有更深的应用,就得用到深度学习。
深度学习
机器学习在于解决实际的问题,而不会有进一步的想法。深度学习旨在模仿人类决策的神经网络,用来解决需要思考的问题。
也正是因为这些研究,诞生了深度神经网络,并在语音识别和图像处理领域有重大的突破。与神经网络不同的是,可以将原始信号直接输入深度神经网络,而不需要创建任何域特定的输入功能。通过多层神经元,深度神经网络可以“自动”通过每一层产生适当的特征,最后提供一个非常好的预测。
机器学习是一种实现人工智能的方法,深度学习是一种实现机器学习的技术,可以用一张图来展示他们的关系
AI在视频中的应用
视频指纹
视频指纹的特征跟人的DNA特征很像,通过AI处理对视频中的每一帧做视觉特征提取、编码、压缩,是根据视频内容生成一串可唯一标识当前视频的指纹字符,可用于视频相似查重、视频版权、广告识别等多种场景。
自编码器
通过自编码器来压缩和降噪,来提取图片的稳定特征。
图片的表征向量计算
计算的流程如下:
(1)训练自编码器后,舍弃解码器;
(2)用编码器对原始图和失真图进行计算,生成新的自编码器的输入和输出;
(3)反复(1)和(2)操作后,将编码器叠加在一起作为图片的特征提取。
关联各帧的表征向量
视频推荐
前一阵子,抖音的日活用户已经突破6亿,数据非常可观,这在个优秀的数据之后,视频推出了很大的力。抖音需要根据不同的用户兴趣推荐不同的短视频,才能吸引大家不断的观看,倘若给一个喜欢美女的用户不断推荐糙汉子,那这个用户很快就失去兴趣。
在推荐系统中,还是拿抖音来举例,其面对海量视频和用户,数据量非常大,一方面,视频和用户更新的速度也非常快,每时每刻都会有新的视频产生,不仅有热点问题,还得平衡新视频和库存视频的观看量;另一方面,用户的喜好也可能会转变,今天喜欢做饭,名他可能喜欢摄影,需要实时追踪用户的兴趣。
拿Youtube的推荐模型来做个简单分析,它可以分成两部分:
(1)生成候选项模型,从百万数量级的视频中进行初筛,选出用户可能感兴趣的百数量级的视频。
(2)精排操作,从百数量级的视频中选出用户最可能观看的几十数量级的视频,并且进行排序。
总结
本文主要简单介绍人工智能的基础知识和视频网站的视频推荐系统,这点篇幅是没法讲清人工智能,真正要深入研究这块,还得需要积累大量的数学和算法知识
参考资料:
《Deep Neural Networks for YouTubeRecommendations》