今日,依图重磅推出了拥有世界级算法优势的云端AI芯片——求索(questcore™)。这是依图推出的第一款云端深度学习推理定制化 SoC芯片,专为计算机视觉领域分析任务打造。性能秒杀英伟达!
算法即芯片的时代来了。
在今天的年度发布会上,拥有世界级算法优势的依图科技重磅推出云端AI芯片——求索(questcore™)!为AI芯片开辟了一条新道路。
选择在擅长的领域继续发挥优势。“求索”是依图推出的第一款云端深度学习推理定制化 SoC芯片,为计算机视觉领域分析任务打造,针对视觉领域的不同运算进行加速,适用于人脸识别、车辆检测等多个应用场景。
加入“造芯”阵营后,依图科技瞄准其擅长的计算机视觉领域,再度打出重拳,这一拳打破了算法公司与芯片硬件公司的“次元壁”。
“求索”已来:云端AI芯片市场再添新玩家
在发布会现场,依图联合创始人兼CEO 朱珑谈到了AI芯片为何难做,用了三个“没有”作为排比句:
- 没有典型场景应用就没有意义;
- 没有超越NVIDIA的芯片就没有意义;
- 没有世界级的算法就没有意义。
如果一款AI芯片没有定制方向、没有超过业内最大咖的玩家、没有顶级算法作为支撑,那么这款芯片就不能称为是成功的,这也是依图所面临的挑战。
依图科技的确拥有世界级的算法优势,但它并非芯片创业公司,在投入大、门槛高的芯片行业,一开始就选择了高端玩家颇多的领域进军——自研云端 AI SoC,颇有要挑硬骨头下手的意思。
先来看下规格:
- 类型:系统级芯片(SoC);
- 架构:ARM ManyCore™;
- 制程:16nm
- 工作记忆内存:LPDDR4X;
- 解码:64路全高清实时。
发布会现场,依图科技首席创意官吕昊为大家进行了芯片演示——他手持一台体积与15 英寸苹果 MacBook Pro笔记本相当的依图原子服务器,成功带动200路摄像头同时完成实时智能视频分析任务。
刚开始大屏幕只显示了服务器处理的27个摄像头画面——一个NVIDIA P4显卡大概只能处理27个摄像头。紧接着,大屏幕画面突然显示了原子服务器同时带动200个摄像头的画面:
一场直观的新品考验。
依图原子服务器基于questcore™ 打造,一台服务器提供的算力与 8 张英伟达P4卡服务器相当,而体积仅为后者的一半,功耗不到20%。在进行视频解析时,1台依图原子服务器(搭载4核 questcore™芯片,除此之外无需其他配置),与8卡英伟达T4服务器(含双核英特尔 x86 CPU)对比,单路视频解析功耗仅为后者的 20%,与8卡英伟达P4 服务器(同样含双核英特尔 x86 CPU)相比,功耗约为后者的10%。
questcore™可独立运行,自研架构,实现高性价比
这款芯片作为服务器芯片可以独立运行,不依赖 Intel x86 CPU,并且采用依图自研的ManyCore™架构,具有灵活可拓展的特质,适配各类深度学习算法。
从这些特性来看,这款云端芯片更看重“实用”二字——如何满足更多的需求、如何将本有的算法优势在芯片上发挥更大的作用、如何适应现有的生态。
简单来讲,它致力于解决一个实在的问题——如何实现高性价比。
“利用算法优势”成为全场发布会的一大关键词。依图认为,好的算法才能更高效地利用芯片架构,才能指导芯片架构设计,把算力更高效地转化为智能。这款芯片基于领域专用架构(Domain Specific Architecture,DSA)理念,专为计算机视觉应用而生。
questcore™是款“自立自强”的芯片:它作为服务器芯片可以独立运行,不依赖 Intel x86 CPU。这也是依图芯片与NVIDIA GPU、Google TPU和其他AI芯片公司研发的AI加速器产品一个很大的不同。
另外,这款芯片采用依图自研的ManyCore™架构,据介绍,同等功耗下,这款芯片能提供市面现有同类主流产品 2~5 倍的视觉分析性能。
如果一款芯片想要实用性强,就必须拥有强大的可拓展性,以便应用于更多的场景。ManyCore™架构能够适配各类深度学习算法,支持TensorFlow、PyTorch、Caffe等各类深度学习框架,便于无缝接入现有生态。在此架构下,questcore™构建的产品和解决方案可以兼顾云端和边缘计算的需求。
据依图科技向新智元介绍,这款芯片能实现性能和功耗比呈量级提升的根本原因之一是:ManyCore™架构针对INT 8数据(8 位整数数据类型)进行加速。
事实上,对于云端 AI 推理或者说视觉推理计算而言,并不需要高精度的计算,低精度的INT8 数据类型已经足够满足需求。采用16nm制程也是考虑现在业界对视觉分析应用的需求。
在投入极高的芯片行业,如何实现高性价比是众多玩家要实际面对的终极问题,算力的提升正是为了解决AI场景中的经济学难题——用更少的成本解决更多的问题。
投资AI 芯片初创团队ThinkForce,依图迈向算法芯片一体化
在发布会上,依图表示未来立足“算法 芯片 数据智能”的极智战略,深入行业,降低人工智能应用落地和推广成本,赋能行业。
据介绍,questcore™芯片的设计和研发正是依图算法团队和ThinkForce团队紧密合作的成果。
事实上,依图科技在AI芯片领域内早有布局。2017年底,依图正式对外宣布战略投资AI芯片初创团队ThinkForce。ThinkForce是中国少有的拥有芯片研发全链路能力的团队,核心成员来自 IBM、AMD、Intel、ZTE 等芯片业界龙头企业,全都拥有十年以上专业芯片研发设计经历,经手过40余款不同芯片的量产。
有了如此高配的芯片研究团队,打破算法与芯片的“次元壁”不再是难事,软硬件一体化的产品也因此诞生。
事实上,次元壁本就不应该存在。市场上并不存在单独能够使用的软件或硬件,整个行业、整个生态一定是紧密结合在一起的。
这款芯片将于与依图智能软件结合在一起,构成软硬件一体化的产品或解决方案对外销售,未来将应用于交通运输、公共安全、智慧医疗和智慧零售等行业。TO B服务崛起之下,软硬件一体化正成为一家AI企业的商业优势,可以为客户提供针对特定场景优化的性价比最高的解决方案。
AI芯片市场逐渐拥挤:“造芯”路上,定制化是未来方向
与依图科技相似的是,Google、微软、阿里等科技巨头也在自研芯片:同样也是通过利用自身特有优势,从而为客户提供更好的软硬件一体化解决方案。越来越多企业加入了轰轰烈烈的“造芯”大军。
AI芯片是个全新战场。
押宝AI芯片可以说是大势所趋,据研究报告显示,目前AI芯片行业生命周期正处于幼稚期,市场增长快,2022年将从2018年的42.7亿美元,成长至343亿美元。
与其他战场相比,这个新战场充满了不确定性,以及更多的机会——一个没有先例可循的智能时代。中国AI创企与世界科技巨头站在同一起跑线上,完全有可能成为新巨头,同时加速数据中心服务器芯片自主可控进程。
美国杜克大学电子计算机工程系教授陈怡然、美国纽约州立大学教授陈逸中曾在文章《中国AI芯片有可能弯道超车》提到:人工智能应用场景千变万化,其中应用的算法之间的差异更是巨大,可以预期未来各项应用将有不同的定制化芯片,出现人工智能芯片百家争鸣的盛况。AI芯片的另一大特点在于它所面对的是一个全新的、还未被大公司充分定义的新的业务场景。即使是NVIDIA,也只是在云计算这一领域有一定的垄断地位。
定制化芯片必然是未来方向。
世界级的创新需要世界级的命题,如今AI普及也成为世界级命题。依图联合创始人兼CEO 朱珑认为AI普及的关键是智能密度,而这里“智能密度”指单位面积硅芯片提供的算力转化的智能。
然而,在半导体的摩尔定律已经临近终结,智能密度继续翻倍不能再只寄希望于摩尔定律。虽然半导体的摩尔定律逼近终结,但算法性能却仍在万倍增长,过去 4 年依图的人脸识别算法精度提升了 10 万倍。
同时,通用芯片已无法解决所有需求,定制化芯片与依图questcore™一样,Google TPU也是一种DSA,针对深度神经网络(DNN)进行加速,Google TPU充分证明了DSA的优势。而对于DSA芯片而言,领域知识是最重要的,需要对机器视觉技术和行业有着深刻理解,这是需要人工智能公司在研发和商用落地中不断积累的。
了解自身优势、了解市场真正需求,提供定制化芯片成为了依图“高性价比”的解决方案,这也为那些想要加入芯片市场的玩家们提供了一个可高度参考的路线。
正如陈怡然教授和陈逸中教授所说的那样,一个成功的芯片项目所带来的不仅仅是销售芯片本身的利润,还有伴随芯片设计、制造以及销售整套流程中产生的支撑产业与生态系统,从而带动软硬件发展、行业标准制定、知识产权销售等产业发展。
算法即芯片,这条新路还会带给AI公司更多的可能性。