最近几年大芯片投资赛道,数GPU热得发烫。一众初创公司涌现,大厂精英抱团创业,巨额融资不断刷新行业纪录。一些成立较早的企业,已经进入研发落地阶段,刚成立不久的厂商,也旋风般推出相关产品。与GPU创业高热相伴的,是从未间断的质疑声:估值虚高,PPT发布,套壳马甲……一些国内GPU创企推出的产品,被认为已经背离了芯片研发规律,成为融资的工具跳板,后生们不讲武德,坏了规矩。
国产GPU创业领域目前存在哪些问题?应该以什么样的态度发展国产GPU?与海外巨头相比,有何差距与挑战?追赶的机会在哪?集微网同产业人士进行交流,探寻国产GPU创业浪潮风起云涌的背后。仔细丈量国产GPU的“成色”,或许有助于更加清醒地正视现实。
一、乱象丛生 泥沙俱下
近两年,受市场需求以及政策、资本的推动,GPU在国内受到疯狂追捧。地缘政治、大国博弈背景下,相较于已有一定积累的国产CPU,国产GPU的破局更具紧迫性和必要性。人才储备程度,科创板提供的退出机制,也为国产GPU的发展创造了良好契机。于是,GPU成为继AI之后,最为性感的芯片投资赛道。资本的蜂拥而至吸引了来自英伟达、AMD、海思、高通等一众大厂精英创业。据不完全统计,目前该领域的初创企业已近20家,所有一线投资机构均参与其中。谈及目前国内GPU创业领域的现状,行业人士李明(化名)认为赛道过热且拥挤,市场鱼目混珠、泥沙俱下。
李明并不否认看到一些企业推出的产品,不管是在跑分还是在标准测试和应用方面都取得了进步,但也有不少产品和演示目前还处于“PPT”状态。对于那些成立一年左右就推出多款产品的公司,在行业摸爬滚打了20多年的李明称“颠覆了自己的行业认知”。
“一块GPU芯片的研发周期从立项到上市至少要3~5年,好的芯片要经过架构和应用打磨,这个过程也不可能低于两年。有的产品宣称是自主设计,但明显违反整个芯片的设计规律。GPU不可能一年半载就设计出来并跑通应用,有可能设计全是外包,或是将已流片的设计的Spec配置稍作修改。”李明分析称。
另一位GPU企业高管王强(化名)认为,一些GPU新势力尚没有明确自己的细分市场,也没有想清楚未来长远的发展方向,只会用PPT吹牛,发布产品参数和性能对比时混淆视听,实际并不能够正常量产或进行流畅演示,真实性和可靠性大打问号。“有的芯片参数比较奇怪,宣称算力是6T Flops/s,存储能力是50GB/s,两者的比例达到120:1,但实际上GPU最理想的比例应该是25:1,这在应用层面非常尴尬,不知所用何处。此外,有的芯片带宽非常低,无论是用于AI计算还是图形,基本上都发挥不出功能。”谈及诸多费解之处,王强直摇头。
行业看来,这样导致的结果是搅乱了市场,浮躁了人心,在GPU这样一个高门槛且重积累的领域,不讲诚信,违背市场、技术规律,待潮水退去后,只能是一地鸡毛。
二、资本裹挟 蒙眼狂奔
GPU创企在产品上的乱象丛生,在行业投资人士张帅(化名)看来,有些是迫不得已。“海思做GPU,前后花了4年半,在华为强大流程体系支持下尚且如此,初创企业难度更大。如果也做这么长时间才出产品,投资人不会答应。”张帅说。 据张帅透露,有的GPU初创公司与投资方签下对赌协议,在某个时间点推出芯片产品,是决定其拿到下一轮融资的入场券。
资本裹挟之下,一些配置错误、不合逻辑、完全不像正常产品的GPU芯片横空出世,冠以自研、国产、打破垄断之名。吃瓜群众亢奋,行业人士错愕。“很多国内GPU的研发,其实已经脱离了芯片开发的初衷,所有的成果展示和发布,其实是以融资为目的。”创道投资咨询合伙人步日欣直言。
赛道的火热以及大规模的融资助推GPU初创企业估值一路走高。一些成立一两年的热门企业,估值已经达到两三百亿元,GPU成为高估值代名词。不少业内人士呼吁,对于那些通过“放卫星”博眼球的方式来吸引关注的可疑产品公司,需要投资人和相关的市场机构进行甄别以及理性对待和评估。
北科建集团产业运营负责人李锴表示,国内GPU从整体而言,受到了政策推动的影响,有了积极进展,尤其包括“东数西算”政策、算力芯片和智慧化应用的市场打开。但目前阶段的投融资热度,还是一种行业聚焦惯性投资,依靠当前的政策性红利,大部分投资标的还属于高风险投资项目。“真正投进去,一是要考虑估值是不是虚高的问题,二是需要专业性的知识背景和能力,考验投资机构慧眼识珠的本领。”李锴说。
但独具慧眼似乎是少数,GPU赛道的玩家更多处于“蒙眼狂奔”中,几年过去,投资热度仍未消减。
张帅不否认GPU赛道过热,但他并不认为GPU创企估值过高,因为在他看来GPU的价值摆在那。“如果真的中美脱钩,高性能GPU被卡脖子,中国一定要想办法替代。一个GPU工程师年薪50万,2000人的企业,人力一年就要10亿,每年二三十亿的整体开支跑不掉。投资方愿意投钱给不同的创业团队也有道理,谁都想赌一把中国的AMD和英伟达。”张帅说。
三、图形/计算 花开两朵
GPGPU、通用GPU、全功能GPU、图形GPU、渲染GPU、GPU ……在国内,GPU命名上的文字游戏已被厂商们玩坏,也让外界对这些产品一时云里雾里。按功能划分,GPU主要分为侧重图形图像的渲染GPU和侧重通用计算的GPGPU。目前国内初创GPU公司,结合自己的优势和阶段性定位,分别采取了不同的切入路线。其中GPGPU公司包括壁仞、沐曦、登临、天数智芯、红山微电子、珠海芯动力等,渲染GPU企业包括摩尔线程、励算、深流微、瀚博、芯瞳、格兰菲等。
沐曦CTO杨建博士指出,GPGPU相当于大算力芯片,是传统计算的回归,GPGPU的创新等同于将一些专用加速功能变成GPU的一组指令集,芯片面积只有原来的1%-10%,却相当于实现了一个全新专有芯片的加持,同时具备通用计算的性能,这使得边际成本更低,更具价值。
而渲染GPU约80%仍是GPGPU部分,20%则是固定渲染流水线(fixed function),例如geometry pipeline、rasterization pipeline等。固定渲染流水线涉及较多的数学公式,因此比较依靠编译器和驱动等软件能力,而GPGPU在硬件和应用层面较为复杂。“从软硬件复杂度看,渲染GPU复杂度更高。从开发人员团队数量来看,GPGPU如需要200人的硬件团队,渲染GPU可能要再增加50人,但软件开发人员相比GPGPU或需增加三倍,需要更多的人员开发驱动和编译器等。”杨建说。
芯动科技首席SoC架构师何颖认为,图形渲染GPU因为经过了十几年的演化进程,流水线长,实现起来复杂,设计上的挑战更大,同时存在很多专利陷阱。“芯动科技目前聚焦于渲染GPU领域,但GPGPU也在规划之中,芯动科技选择的是一个起步很难但可以走得很远的赛道。虽然GPGPU的价值很高,增长也不错,但图形渲染GPU在细分市场总的体量更大。”何颖告诉集微网。但杨建认为,对于一家初创公司的首颗GPU产品来说,如果要同时自研渲染GPU的固定渲染流水线IP、统一着色器(shader)IP,需要的时间和人力成本将非初始的几百人团队可以承受。因此,沐曦采取先做GPGPU,再发展图形渲染GPU的模式。在自研GPGPU中,只有统一着色器IP,不需要固定渲染流水线,这样可以在自研GPU的道路上一步一个脚印稳健前行。
四、核心IP 十年差距
任何一款高端芯片的打造,都离不开基石——IP的“成全”,IP的质量很大程度上决定了国产GPU性能的底色。
在步日欣看来,GPU作为高性能的大芯片,想在短期内出成果,必然需要依赖外部IP。国产GPU厂商能够快速推出相关产品,很大程度上依靠外购IP。
但打着自主研发之名,行外购之实,推出“马甲”产品就难免有忽悠之嫌,这样的案例在芯片领域本就不在少数。自研IP越多,芯片设计上越有把握,产品的差异化更明显。但相对而言,资金、人员、时间上的成本投入也更高。王强告诉记者,GPU IP自研需要36-48个月以及200个工程师,而采用外购IP的方式,可以减少12-18个月开发周期。
李明则表示,考虑到GPU的研发非常考验项目的目标管理能力,对于团队能力和组织工程能力要求很高,初创企业由于能力有限,短期内如果自研路线不顺利,会选择大量外购IP或“马甲”路线。但从长远看,公司团队的成长、市场定位以及盈亏平衡不能得到保证,而且会逐渐拉开跟行业领先公司的差距。
据集微网了解,GPU 的IP主要涉及三大类,一是模拟IP,包括PCIe、Displayport和HDMI等等,这方面国内厂商占有率较低;二是Memory;三是数字IP,包括基于Arm或RISC-V的微控制器IP、编解码芯片IP以及最核心的GPU IP等。核心IP国内有Imagination、芯原、格兰菲等厂商,相对而言,Imagination认可度较高,芯原是后起之秀,而格兰菲主要面向特定领域用户。在李明看来,国内核心IP能力至少比英伟达、AMD等落后十年左右。而整体而言,GPGPU企业与国际大厂技术差距约3年,渲染GPU与国际大厂差距约10年左右。
李锴认为,国内GPU底层技术空白点较多,IP大多受制于国外厂商,产品前端稳定性不理想,目前又很难在主线中高端电子产品上得到普及化应用,需多年沉淀形成自主IP积累才能具有一定替代性。需要指出的是,外购IP并不意味着无法自主可控,但对GPU企业的能力要求很高。据何颖介绍,芯动科技与Imagination的合作是与苹果一样的架构授权,基于该初始架构芯动科技探索了很多自己的方案,包括自研的Cache一致性Innolink Chiplet技术,内置国产物理不可克隆iUnique Security PUF信息安全加密技术等。“芯动科技去年推出的渲染GPU‘风华1号’80%以上的IP都属于自主研发。既然已经获得了架构授权,芯动科技就可以不受限制地自行改进,能够做到自主可控。”何颖说。
五、生态之路 道阻且长
除了硬件性能上的比拼,高性能芯片的生态搭建也是绕不过去的一道坎儿。某种程度上,生态比硬件更重要。步日欣表示,在最终量产和商业化产品出来之前,国产GPU还没到谈论生态和应用层面的地步,而杨建认为,GPU生态是除产品外初创企业能否活下来的重要因素,是一开始就要考虑的问题。
对于渲染GPU和GPGPU而言,构建生态的难度截然不同。渲染GPU在技术层面来相对复杂,但是好处在于有很多业界成熟的标准的API,如OpenGL、OpenGL ES、DirectX、Vulkan等。只要打通了整个驱动程序层和编译器生态,就基本完成90%。
而在GPGPU领域,几乎是被英伟达一手打造的CUDA生态所垄断。“GPGPU的生态非常复杂,要求一路打通到应用层,提供面向所有应用的全面支持,甚至要自主开发以支持一个新的应用领域。”杨建指出。虽然不少GPU初创公司推出的产品都号称兼容CUDA生态,但李明认为存在兼容多少的问题,水分较大,比较重要的特性中可能60%-70%都无法支持。
而据了解,兼容CUDA并非易事,需要投入工程师的数量巨大。涉及50个驱动、50个编译器、50个数学库、300个应用层工程师,3-5年的时间。功能的验证,用户的培养需要额外3-5年,每年还要至少开支1000万-3000万元资助外部开发者。“使用的人越多,生态越占统治地位,看看国内的初创GPU企业,哪些是已经开始编写教材、在高校开课和开展合作项目、组织比赛等做这些人才培养方面的工作,就知道谁真正在沉下心来做生态了。”李明说。
何颖指出,国产GPU业应采取开放合作的心态,学会站在巨人的肩膀上,善于利用现有架构和生态,设计契合市场需求的优秀产品,打造全球化设计水平的开发团队。国产GPU在起步阶段兼容现有生态更容易发展,先求生存;长期还是要摆脱兼容思路,站稳脚跟后再求发展自有的核心技术。在GPU生态中,软件的权重已越来越高。Imagination中国区战略市场与生态副总裁时昕博士提及,GPU软件极为复杂,包括各种图形API和计算接口、基础库、与上层应用对接适配等等,开发工作量巨大。从应用角度来看,国内GPU生态的发展更需要“众人拾柴”。时昕认为,要加快打造国产GPU产业链,下游的整机厂商需要对国产GPU给予更多包容。
“国产GPU可能99%已达标了,如果能帮助国产GPU厂商一起将这百分之一影响体验的最后一步补齐,做到更完善,这对其发展是非常重要的。”时昕强调。
六、掘金市场 盈利维艰
对于GPU创企而言,巨大的研发费用和资本开支是必需,但长期、持续的利润支撑才是GPU跨代发展的强劲驱动力。也就是说,GPU的成功和成熟需要大量的验证和出货,这就需要国产GPU厂商瞄准目标应用市场发力。步日欣认为,对于初创企业而言,渲染GPU涉及到生态建设的完善度,所以从信创、军工、工业等领域切入较为稳妥。而GPGPU市场从人工智能、服务器、高性能计算等领域切入是最优选择。
但初创GPU企业掘金市场的现实却相对骨感。
比如,在渲染GPU的传统应用如视频、游戏等领域,英伟达和AMD构建的护城河可谓固若金汤,国内企业与之差距较大,而且这一市场全球容纳三四家都比较困难。短期看,虽然国内信创市场提供了一定空间,但总量不大,且偏向于中低端。因此,如何分食这一“蛋糕”之下还能实现正循环,是国内渲染GPU厂商面临的问题。从中长期看,虽然云端渲染成为新的增长点,但元宇宙、云游戏、云手机等市场普遍认为将在2024年前后起势,因此当下如何获得盈利求生存也是艰难挑战。
而在GPGPU方面,比如在AI计算领域,则面临场景应用复杂且碎片化,以及国内众多竞争对手混战的局面。何颖认为,游戏、3A大作对GPU的图形和计算相对要求比较全面,国内企业在Windows领域追赶难度较大,但在安卓手游、信创桌面和某些定制的服务器领域,以及自动驾驶领域,国内厂商有机会实现切入。目前,芯动科技的风华系列GPU瞄准国产信创桌面和服务器这两大细分领域。相较于信创市场,服务器显卡单价更高,实现盈利较有希望。
而杨建则指出,除生态之外,当下对于初创GPGPU企业生存而言,最大挑战是产能。
“目前和AI相关的大芯片,因为需要Cowos等先进封装,所涉及的中介层原材料非常紧缺,在目前产能吃紧的情况下,对于已经推出一些产品的初创GPU企业,会面临短期盈利的问题。”杨建说。
七、弯道超车 路在何方
我国在高端GPU领域缺席多年,面对海外巨头固若金汤的专利、生态等壁垒,GPU业从战略布局成长为核心支柱,显然还有漫长征途。行业人士看来,国内GPU企业发展破局的关键在于找准定位,贴近市场。
何颖特别强调,国内的渲染GPU厂商应该着重于贴近市场的定位和创新,使得设计和能效能够贴近应用,力争在专有应用领域或局部领域实现突破,然后再进一步拓展和打磨经验和能力,使得最终在生态和应用上能跟技术创新良好结合,形成正向循环。“跟国外巨头相比,国产GPU在一些专用领域优化方面,并不是完全亦步亦趋。通过在这些领域发力,能够在计算密度或在工艺、节奏、带宽密度等面体现出差异化,可以使产品在性价比,在某些特种应用方面能够达到国外GPU的能效,甚至做得更好。”何颖说。杨建则表示,在GPGPU方面,英伟达没有百分百的优势,国内GPGPU在某些方面可以说是超越的。国内厂商在HPC和服务器、通用计算等领域可以依托Linux的开放性和可控性强的优势,实现有效突破。在杨建看来,国内GPU厂商的最大优势在于本土支持。
“如果整个市场是一个地图,国内GPU厂商可先撒点,针对一些特定市场循序渐进抢占生态,加强与国内厂商的紧密合作,积累一定的优势和声誉后,再由点及面布局寻求突破。”杨建建议。
多位受访者提及,高端芯片研发周期长、投入大,没有足量资金支持无法取得成功,但过度的投资热潮容易滋生投机现象,互联网投资的模式并不适用于芯片领域,国产GPU要谨防重蹈AI芯片的覆辙,需要正视差距,脚踏实地前行。“烧钱的模式是难以为继的,只有踏踏实实服务客户,服务市场,并且能够不断的回收研发成本,进一步实现创新,才是国产GPU的成功之路。急功近利,疯狂招人,疯狂烧钱的模式,实际上不可能快速弥补国产GPU跟国外GPU之间的差距,因为国外的GPU是一个个应用打磨出来的,国产GPU一定要有耐心,才能够在这个领域实现创新和弯道超车。”何颖说。
步日欣指出,国内GPU距离国际大厂还有很长的距离,特别是目前的竞争格局下,国内GPU还处于野蛮生长阶段,虽然资本市场较为关注,但同质化竞争和创业造成了很大的人才和资金的浪费,一定程度上制约了国产GPU的发展进程。“下一步这几十家GPU企业,肯定要面临一定程度洗牌,那个时候才是真正的国产替代、缩小差距的开始。”步日欣说。