666元!英伟达史上最便宜AI硬件发布:可运行所有AI模型,算力472 GFLOPS,功耗5瓦

2019-04-23 11:16:08 浏览数 (1)

李根 乾明 郭一璞 发自 圣何塞 量子位 报道 | 公众号 QbitAI

中国古语有言:否极泰来。

AI芯片巨头英伟达的2018,再糟糕不过,所以2019年GTC大会,也比以往更受关注。

而且颇有意思的是,教主黄仁勋把这次的主题演讲地点选在了圣何塞州立大学礼堂。

这所公立大学在硅谷小有名气,且在计算机领域,最有名的校友莫过于原Intel董事长高登·摩尔——“摩尔定律”就是以他之名命名。

而老黄就是那个全世界最热衷宣扬“摩尔定律已经失效”的人。

但这一次,老黄一句“摩尔定律”都没提,默默扔出99美元AI开发套件Jetson Nano。

具体情况怎么样,我们完整回顾下今年GTC发布情况。

CUDA-X:50倍提速

首先,直接看核心重头戏:CUDA-X。

按照英伟达的说法,这是全球唯一的一个,端到端的数据科学加速库。帮助从事数据分析、机器学习、深度学习的数据科学家们,更快完成工作。

CUDA-X由十几个专用加速库组成。整个系统中,包含几个部分:用cuDF加速数据分析,用cuDNN深度学习原语,用cuML进行机器学习算法,和DALI等数据处理。

简单来说,所有英伟达的库,都被整合成一个库:CUDA-X。

包括TensorFlow、PyTorch和MXNet在内的所有深度学习训练框架,随着CUDA-X的发布也会自动为英伟达Tensor Core GPU进行优化。

英伟达表示,CUDA-X解锁了Tensor Core GPU的灵活性,能够将机器学习和数据科学工作负载加速多达50倍。CUDA-X可以加速典型AI工作流程的每一步,无论是用深度学习训练语音和图像识别系统,还是数据分析评估抵押贷款组合的风险。

而且据说,“只需要点击几下”。

微软的Azure Machine Learning(AML)是第一个集成RAPIDS的云服务,RAPIDS是CUDA-X的关键组件。通过访问RAPIDS开源库,数据科学家可以让AML上的英伟达GPU以“前所未有”的速度进行预测分析。

英伟达官方披露的数据称,在AML上使用RAPIDS,可以帮助企业把训练AI模型所需的时间,减少多达20倍,训练时间可以从数天减少到数小时,或者从数小时减少到几分钟。

此外,CUDA-X还会部署在几大主流的云平台,包括亚马逊AWS、谷歌云等。目前PayPal、沃尔玛等公司已经在使用相关服务。

值得一提的是,在介绍CUDA-X的时候,老黄还皮了一下。他说:每次演讲,我都想让你们记住一个关键词,今天的关键词是:

PRADA。

还让现场跟着一起念。看来接下来要发布的东西,可能还挺贵。

PRADA其实是四个单词的强行缩写,它也带代表对CUDA-X介绍的几个方面:PRogrammable(可编程)、Acceleration(加速)、Domains(域)、Architecture(架构)。

史上最便宜AI硬件

老黄两个多小时讲完后,最让网友们念念不忘的,是一款出场非常晚、时间非常短的硬件产品:

Jetson Nano。

它是体积小巧、性能并不弱的小电脑,老黄称之为“全新的机器人计算机”,共有两个版本。

一是99美元(约合人民币666元)的开发者套件,面向个人用户,比如创客、学生、技术爱好者;另一个版本129美元,可以部署到生产环境,面向的是想要构建边缘系统的企业。

历次发布会都让人深感贫穷的英伟达,终于也价格厚道了。在PRADA的衬托下,更是感动人心。

不少外媒纷纷打call,因为Jetson Nano的价格让业余爱好者、学生之类的大众群体,可以打造自己的自动化设备。

当场,老黄也拿出了一个基于Jetson Nano的无人车Kaya。

价格厚道,性能如何呢?Jetson Nano能提供472 GFLOPS的计算性能,而耗电量只有5瓦

不久前Google发布的千元TPU开发板,单精度和半精度浮点运算性能分别是32和64 GFLOPs;英特尔神经计算棒的性能是100 GFLOPs。

Jetson Nano搭载了4核的ARM A57 CPU和128核基于英伟达Maxwell架构的GPU,4GB内存,使用MIPI CSI-2 DPHY通道摄像头。

它也支持今天发布的CUDA-X,也就是说有支持很多常见的人工智能框架,装有面向Tegra的Linux操作系统,实现了开箱即用。

英伟达会后还展示了Jetson Nano运行ResNet、Inception、YOLO等各种神经网络模型,在目标检测、姿势估计等各类任务上进行推断的实际性能:

此外,它还支持高分辨率传感器,而且可以并行处理多个传感器,并在每个传感器流上都运行多个神经网络。

英伟达称,Jetson Nano能够运行所有AI模型,可以创建数百万个智能系统。

GTC刚结束的时候,就有人在HackerNews上表示,自己想要DIY了。

很快就有“同道中人”回复他,你可以自己做无人驾驶小车、能跟踪猫的无人机、可以自动识别鸟的摄像机等等。

自动驾驶

最后,自动驾驶,老黄说这是最重要的自动化机器的落地场景。

也是三方面。

首先,推出全新DRIVE Constellation自动驾驶汽车仿真平台。

基于该平台,在云端就能虚拟仿真各种自动驾驶场景——不用再路测数百万公里了。

老黄说,从常规驾驶,到各种罕见的危机情况,都能在仿真中实现,要风得风,求雨得雨。会比现实世界中实现的效率高出不知多少倍,而且成本低、安全性高。

数据中心方案则去年就有过官宣。包括两个并排服务器:

第一台服务器——DRIVE Constellation Simulator,从虚拟汽车生成传感器输出。

第二台服务器——DRIVE Constellation Vehicle,包含DRIVE AGX Pegasus AI车载电脑。

DRIVE AGX Pegasus接收传感器数据,做出决定,然后将车辆控制命令发送回模拟器。

老黄还强调,该过程完全闭环,而且定位精准、定时精确,测试环境也能随心所欲——不用怨天求神。

其次,该平台完全开放,提供编程接口,允许DRIVE Sim生态系统合作伙伴集成他们的环境模型、车辆模型、传感器模型和交通场景。

同时也通过整合合作伙伴的场景,让平台可以生成全面,多样化和复杂的测试环境。

换而言之,玩法有点像虚拟仿真领域的Apollo。

英伟达也在这个“开放生态”里,集合了产业链上下游玩家。

第三,英伟达还宣布了基于仿真平台的最新合作。

并且合作方来头不小,是全球第一大车厂——丰田。

老黄的意思也再明确不过,像丰田这样的大厂都当了首个客户,开放平台DRIVE Constellation的品质肯定值得信赖。

此外,还是在GTC大会上,老黄还宣布推出新自动驾驶软件套件,该软件的主要组成部分是Safety Force Field(SFF),通过加强规划和控制,实现更安全、舒适的驾驶体验,而且其算法策略主打车辆保护、乘客和其他车辆安全。

在高级辅助驾驶领域,这会最先发挥作用。

老传统:视觉渲染新突破

当然,英伟达的GTC,不炫下最新渲染成绩怎么行?

今年新亮相的图像渲染引擎,让图片的渲染更快、更真实。

NVIDIA Omniverse,3D创作渲染协同工具,即使团队成员身处不同的时区,也能一起为同一个3D场景的创作出力。

另外,现场还展示了一段视频:

是不是很有大片感?

同时,英伟达宣布Adobe、Autodesk、Epic、Unity等16家厂商也将得到RTX技术支持,帮助他们在复杂的场景中完成光线跟踪照明,用更快的速度进行图像渲染,这一技术支持在今年内将会服务900万创作者。

另外,对于游戏玩家,英伟达推出了GeForce NOW云游戏服务,游戏在云端的电脑上运行,而玩家只要打开任何一台PC或者MAC,就能让云端的游戏显示在自己的电脑上,无需下载、安装、升级、更新、装补丁,也不用担心自己的电脑配置不够了。

显然,老黄也最爱这部分的Demo展示。

不断播放视频,不断收获掌声,他还不断告诉大家:鼓掌太早了,好戏还在后面。

甚至到后来,教主直接扔核弹语录:

我常说,买得越多,省得越多,现在我觉得我错了……RTX Sever根本就是免费的!省下的电费就能买一台服务器了!

老黄の诚意

不过今年GTC,新品确实便宜得不像英伟达。

会后,大家最主要的评价都集中在Jetson Nano上。

更直接说是99美元售价上。

虽然TheVerge也报道称,这种低价的AI开发套件,英伟达并非独一家。

比如英特尔的Neural Compute Stick只需要79美元,谷歌在Coral下最近也推出了两款设备,分别是150美元的开发者套件和79美元USB加速设备。

但不可否认的是,英伟达正在进入一个有潜力的市场,AI驱动的创新正在增长。

而且,对于今年GTC主题演讲关键词是PRADA的英伟达来说。

99美元,折合人民币666元。老黄的诚意,看得见。

你觉得呢?

作者系网易新闻·网易号“各有态度”签约作者

0 人点赞