DPU火了,火的猝不及防又理所当然,甚至可以说DPU是当前芯片行业最热的方向,没有之一。
DPU为什么火了?DPU大热背后,是概念炒作还是需求驱动?要回答这个问题,还是得从DPU的价值说起。
DPU,即Data Processing Unit的缩写,直译为数据处理单元。简单总结DPU的三大价值,即卸载、加速、隔离。
卸载,原本需要消耗大量CPU资源却不一定能完成好的服务,比如网络的虚拟交换、虚拟路由,存储的RDMA、NVMe,安全的防火墙、加解密等。
加速,原本需要通过软件并在CPU里运行的一些应用和服务,也就是近些年常听到的“硬件加速”。
隔离,即与CPU运行的任务进行隔离,保证CPU任务的性能和安全性。
其实从DPU的价值定位不难看出,DPU的核心价值主要是在弥补CPU的不足。
事实上,DPU已经不是第一个为弥补CPU能力不足而发扬光大的产品,多年前GPU的大热也是为了弥补CPU在图形处理能力方面的短板。
换句话说,从CPU、GPU再到今天的DPU,技术变革背后体现的其实是时代的变化、用户需求的变化。
伴随数字经济时代的到来,大量数据无法有效及时处理,而这意味着数据蕴藏的价值无法变现。
与此同时,摩尔定律失效,CPU能力增长见顶,而基础架构由硬转软,虚拟化、云计算大规模普及又消耗了大量的CPU资源。
两股力量共同催生、推动新的技术来填补空缺。在这样的大背景下,DPU应需而来,并迅速获得市场认可。
因此,无论GPU还是DPU的出现都是一种必然,是用户需求倒逼技术革新的结果。
未来还可能会出现XPU,但目的只有一个,即更好的支撑数字经济时代的发展。
百家争鸣
谁能笑到最后?
数字经济,毫无疑问的大市场。
巨大的市场需求推动越来越多的玩家进入DPU市场。其中,既有传统芯片巨头如NVIDIA、AMD,也有阿里、华为等云玩家,还有大量新兴创业玩家。据不完全统计,国内致力DPU领域的创业公司有几十家,好不热闹。
出发点不同、技术实力不同,打造的产品解决方案、致力的目标自然不尽相同。
截至当前,DPU领域的玩家大致分为几类,有专注在通用解决方案的,有聚焦在不同使用场景的,如网络、存储、安全等,也有只服务自己生态的。
目前,DPU还处于发展初期,即风口期,我们还无从判断谁能笑到最后。
但透过考量芯片的重要指标,不难去做一些推断,研发芯片最重要的两个维度:一是产品本身,能否满足时代的需求;二是生态,即软件、开发环境和合作伙伴,众所周知,没有生态支撑,芯片只是一粒粒沙子。
两个维度涉及到两方面的实力,一是企业研发实力如何,二是聚合生态的能力如何?
显而易见,只有能顺应用户需求,并有坚强实力做后盾的玩家才有可能决胜到最后,NVIDIA无疑是其中之一。
之所以作出这样的判断,一是底蕴,NVIDIA是做芯片起家的,GPU领域是绝对的王者,进军DPU领域,属于顺理成章;二是格局,GPU领域,NVIDIA搞的就不单是产品,而是生态,有硬件、有软件、有开发环境、有合作伙伴,进军DPU,轻车熟路。
事实也确实如此,尽管业界DPU玩家的起步时间差不多,但NVIDIA当前已经基本完成了在DPU领域的布局,软硬一体,生态优先。
下面详细解读一下NVIDIA在DPU领域的布局。
软硬一体
打造的是体系
同GPU一样,NVIDIA DPU从一开始的定位就不是专用,不是服务于某几个场景,而是数字经济的整个星辰大海。
可以用几个关键词来总结NVIDIA DPU的特质:通用、软硬一体、开放、生态优先。一样一样展开,先看产品。
硬件:NVIDIA BlueField,可以通过对各种高级网络、存储和安全业务进行卸载、加速和隔离,可为云、数据中心或边缘计算等环境中的各种工作负载提供安全加速。
根据使用场景的不同,NVIDIA还可提供BlueField-3 DPU、BlueField-2 DPU及NVIDIA融合加速器多种不同的产品。
软件:NVIDIA NGC目录中提供了NVIDIA DOCA软件框架。
特别值得一提的是,DOCA是NVIDIA为DPU量身打造的软件框架,开发者可以利用DOCA创建高性能、软件定义、云原生、DPU加速的服务,以便对面向未来的数据中心基础设施进行编程。
与此同时,NVIDIA还提供Morpheus软件。作为一个 AI 应用程序框架,Morpheus可为网络安全开发者提供高度优化的AI 流程和预训练的AI 功能,使网络安全开发者能够快速检测和处理安全威胁。
除此之外,经过NVIDIA认证系统认证的NVIDIA EGX平台可提供出色的多节点扩展能力。
从硬件、软件,到开发环境、集成平台,显而易见,NVIDIA不只是专注在研发本身,更愿意赋能,把DPU的能力带给更多的企业、更多的开发者,让更多人享受到DPU的红利。
事实上,为了推动DPU的发展,NVIDIA当前已经落地了非常多有建设性的举措。
比如,2022年初,NVIDIA就授权丽台(上海)信息科技有限公司和上海信弘智能科技有限公司两家合作伙伴设立DPU& DOCA卓越中心,为DOCA中国开发者提供在线实践的免费开发环境,实现编译、运行、测试DOCA应用程序。
另外,在2022年初,NVIDIA还举办了首届DPU中国黑客松竞赛,以赛促学、以赛促发展。
很快在10月,NVIDIA还将举办秋季DPU黑客松比赛,本次竞赛旨在帮助开发者通过 NVIDIA DOCA 软件框架构建创新的 RDMA 加速存储与 AI 应用程序,基于 NVIDIA BlueField DPU与 NVIDIA InfiniBand 网络实现存储、AI 卸载、加速和隔离功能,引领新一代人工智能就绪的基础设施,驱动未来 AI 工厂,欢迎关注。
除了构建软硬一体的产品生态,在合作伙伴生态构建方面,NVIDIA同样下足了力气,除了提供NVIDIA DOCA软件框架供开发者学习使用,还积极与生态伙伴打造面向最终用户的解决方案。
下面透过几个案例来分析NVIDIA DPU真正能带给用户的价值。
中国移动,三大运营商之一,基于Nuage Network和NVIDIA共同打造的SDN 解决方案,显著提高了网络性能,提升了用户满意度。
与单独在软件中运行 OVS-DPDK相比, Nuage Networks VSP和 NVIDIA硬件加速vDPA的联合解决方案使得网络吞吐量增加了1.5倍,数据包转发速度加快了3倍,Apache基准测试每秒支持的请求数增加了7倍。
UCloud,中国云计算第一股。从2018 年起,UCloud开始积极探索基于 NVIDIA BlueField DPU 的高性能的裸金属物理云方案。
截止当前,依托NVIDIA BlueField DPU ,UCloud裸金属物理云方案在网络和存储方面都达到了行业领先水平。
数据为证,UCloud裸金属服务基于 NVIDIA BlueField-2 DPU 可实现99.999999%的数据持久性,并将 IO 时延降低至100微秒,可用性提升至99.95%。
同时由于实现了IO 数据的零拷贝,UCloud UDisk RSSD云盘性能提升至少 20%,单盘4k IOPS 高达75w,带宽高达3GB/s。
网易数帆,网易旗下数字化转型技术及服务供应商。
网易数帆裸金属服务器解决方案利用NVIDIA BlueField DPU不但实现与现有 VPC的兼容互通和协同,而且还将网络相关的工作负载从裸金属服务器主机CPU卸载,释放宝贵的硬件资源给关键业务应用,并实现裸金属服务器网络部署接入的性能加速。
从硬件、软件到社区,再到伙伴,NVIDIA打造的是一个体系,目标是服务整个数字经济时代。
NVIDIA希望通过赋能的方式,将DPU的能力带给更多的企业、更多的开发者,让更多人享受到DPU的红利,而不是将自己局限于产品解决方案供应商这一身份。
能提供价值才是硬道理
DPU市场目前还处于春秋战国时代,谈胜负为时尚早。
可以肯定的是市场足够大,毕竟数字经济时代,数据为王,要想数据发挥出最大的价值,离不开计算。这也是为什么那么多企业涌入这条赛道的原因。
与此同时,历史也在告诉我们,芯片不是一个能快速变现的产业。
这意味着想赚快钱基本是不可能的,只有把更多精力专注在为用户提供价值上,才有可能笑到最后。用这一条去衡量DPU市场的玩家,能满足条件的其实并不多。