人工智能芯片主要技术特征/发展态势 | AI划重点 | 解读行业

2020-08-04 11:57:53 浏览数 (1)

懒人阅读:人工智能芯片是人工智能的“大脑”,可以分为终端和云端两个应用方向。目前主流CPU、CPU GPU、CPU FPGA、CPU ASIC架构。人工智能芯片具有两个突出特点:一是算法与芯片的高度契合,面向终端和云端不同需求提升计算能力;二是专门面向细分应用场景的智能芯片,如语音识别芯片、图像识别芯片、视频监控芯片等。


人工智能的核心在于两个环节:训练(Training)算法和利用算法推理(Inference)结论。特别是度学习不仅在传统的语音识别 、图像识别、搜索/推荐引擎、计算广告等领域证明了其划时代的价值,也引爆了整个人工智能生态向更大的领域延伸。由于深度学习的训练(training)和推断(inference)均需要大量的计算。正是由于这两个环节中需要强大的计算能力进行支撑的需求的出现开辟了一个新的发展方向,传统芯片对于计算能力支撑不足导致更适合人工智能计算需求的芯片开始出现。

伴随着深度学习理论引领了人工智能最新一轮热潮,芯片是完成计算的核心,是人工智能的“大脑”,必将越来越得到重视。人工智能芯片可以分为终端和云端两个应用方向。由于应用场景对性能、时延等参数提出具体的要求,计算核心处理器所处的位置成为不同厂商的争论焦点。有人认为,需要在设备端就能迅速反馈结果,而另一派认为应该将采集到的数据传回云端,由服务器进行终端设备难以匹敌的复杂计算。

目前主流CPU、CPU GPU、CPU FPGA、CPU ASIC架构均因硬件规模、算法、功耗等原因不符合AI芯片理想架构,相对来说功能动态、实时地跟随软件变化而变化更重要。目前,GPU 芯片的同步并行运算非常适用于人工智能的深度学习神经网络。事实证明,在浮点运算、并行计算等部分计算方面,GPU 可以提供数十倍乃至于上百倍于CPU 的性能。目前国际GPU市场被NVIDIA 和AMD(英国) 两大公司瓜分。谷歌无人驾驶汽车所采用的技术部件中,就采用了NVIDIA 的移动终端处理器Tegra(4 核CPU 256 核GPU)

人工智能芯片具有两个突出特点:一是算法与芯片的高度契合,面向终端和云端不同需求提升计算能力;二是专门面向细分应用场景的智能芯片,如语音识别芯片、图像识别芯片、视频监控芯片等。特别是图像和视频中包含了非常丰富的视觉信息,但是从它们之中分析提取中语义级别有价值的信息是非常消耗资源和时间的,而实际上图像,尤其是视频中存在大量冗余信息,必须针对这样的特点进行专门的算法设计。人工智能不只是要求深度学习的芯片,今后将有更多的算法要求硬件支持。

目前随着计算能力和通信能力的大幅提升,智能汽车大规模的市场容量带来的想象空间,使得自动驾驶已成为被广泛看好的人工智能(AI)应用领域,成为投资与技术研发竞相角力的主战场,而“芯片 算法”是能够取得关键点。

在云端这个领域,因为要处理海量的数据,Nvidia的GPU已经成为服务器不可或缺的一部分,但Nvidia自己目前还没有打算大规模自己做服务器,因此在人工智能的云端市场,Nvidia提供的是硬件而非平台。而在终端这个领域,Nvidia基于GPU的人工智能平台一方面功耗太大,另一方面过高的计算能力反而导致成本过高,因此无法与定制芯片抗衡。其实,Nvidia的人工智能平台最具优势的应用场景是上面两种情况的中间,即数据量中等、对计算能力要求还比较高、对功耗有一定要求但是并不苛刻的地方,比如高级辅助驾驶ADAS市场。Nvidia人工智能平台无论计算能力(10-100TOPS)还是功耗(10-100W)都能完美地符合要求,符合自动驾驶市场的硬件需求。

Intel在收购Altera之后推出了基于FPGA的专用深度学习加速卡,积极抢占云端市场,正在积极推广结合其技术为AI优化的Knight Mill至强处理器,目标也是在云端。在车载端,Intel与Mobileye和BMW结成了自动驾驶联盟,Mobileye提供传感器芯片和算法,Intel提供云端计算平台,BMW提供汽车。在手持移动端,Intel收购了Movidius,在移动端的人工智能芯片方面进行发力。

谷歌为其深度学习神经网络打造基于ASIC 的专用TPU 芯片。该TPU 芯片也用于AlphaGo 的系统中。ASIC 是专用 集成电路 ,具有体积更小、功耗更低、性能提高、保密性增强、成本低等优点。TPU 目前在谷歌主要用于:1)、机器学习系统RankBrain,用于帮助谷歌处理搜索结果;2)、街景StreetView,用于提高地图与导航的准确性;3)、围棋人工智能AlphaGo,其最初版本使用48 个CPU 8 GPU,对战樊麾时升级到1202 CPU 176 GPU,对战李世石时升级至TPU 版本。

微软重点研发FPGA 人工智能芯片,推出基于FPGA 的视觉芯片,目前硬件将FPGA 已经被应用在Bing搜索的支持上,基于神经网络推动新的搜索算法,执行速度比传统的芯片会快很多倍,只需要24ms 就可以实现搜索,规避了以往长达四秒搜索空白的尴尬。其FGPA 同样能够支持微软的云计算服务Azure,未来微软全球的数百万部的服务器将会用FPGA。

同时微软推出基于FPGA 技术的视觉芯片A-eye,使得摄像头具有视觉理解能力。FPGA 的输入到输出之间并没有计算过程,只是通过烧录好的硬件电路完成信号的传输,因此运行速度非常高,可达CPU 的40 倍。目前的摄像头主要完成记录、存储等功能,在摄像头上加入A-Eye 视觉芯片,就可以让摄像头具有视觉理解能力。A-Eye 可以广泛应用在智能安防,婴儿和老人看护,战场机器人,汽车和无人机等各种需要视觉智能的领域。

0 人点赞