ARM十年磨一剑,v9新架构会重构CPU市场吗?

2022-04-16 13:49:00 浏览数 (1)

近日,ARM正式宣布推出ARMv9架构。据ARM官方称,这是10年来最重要的创新,是未来3000亿ARM芯片的基础。

与上一代的ARMv8相比,ARMv9处理器将不再局限于移动/嵌入式市场,而是扩展到PC、HPC高性能计算、深度学习等新市场,以满足全球对功能日益强大的安全、人工智能和专用处理的需求。

ARMv9架构的发布,会对CPU市场带来什么样的影响?对于中国而言,是否能够解“缺芯”之急呢?

ARMv9的三大亮点

2011年10月,ARM首次发布ARMv8架构,十年后的今天,ARMv9立足于ARMv8的成功基础,将成为担纲未来十年的主流计算架构。那么,它和ARMv8架构相比有哪些不同呢?

据ARM高级副总裁、首席架构师兼技术院士Richard Grisenthwaite介绍,ARMv9继续使用AArch64作为基准指令集,但是在其功能上增加了一些非常重要的扩展。

他指出ARMv9有三个主要支柱,即:安全性、AI(机器学习)以及改进的矢量和DSP功能。

亮点一:安全

为了解决当今最大的技术挑战——保护全球数据安全,ARMv9架构路线图引入了ARM机密计算架构(Confidential Compute Architecture, CCA)。

机密计算通过打造基于硬件的安全运行环境来执行计算,保护部分代码和数据,免于被存取或修改,甚至不受特权软件的影响。

例如,在ARM TrustZone的基础上,可以将个人银行信息与智能手机的社交媒体应用完全分离。ARM CCA的新安全功能意味着,即使社交媒体应用真的感染了恶意软件,也不会传播设备其他部分。

ARM CCA还引入动态创建机密领域(Realms)的概念,机密领域面向所有应用,运行在独立于安全或非安全环境之外的环境中,以实现保护数据安全的目的。

例如,在商业应用中,机密领域可以保护系统中商用机密数据和代码,无论它们正被使用、闲置或正在传输中。在云中,这也意味着保护物理CPU以及运行在第三方代码旁边的虚拟化处理器。

此外,ARM持续与谷歌合作开发的内存标签扩展(MTE)技术,将成为第一代基于ARMv9-A处理器的一个组成部分。

过去30年中,许多广为人知的数据安全漏洞,都是利用计算机如何存储和调用内存中的数据的漏洞造成的。如果黑客知道一串重要数据的位置,他们就可以用恶意代码覆盖它。

MTE使开发人员能够使用“标签”锁定数据串。然后,只有使用正确的密钥才能访问该数据,该密钥由“指针”(负责从内存中调用数据的代码)持有。实现锁和密钥访问是一个巨大的步骤,不仅可以确保数据的安全,而且还可以保证数据的安全。

亮点二:针对AI机器学习的优化

机器学习是ARMv9的重要组成部分,ARM认为在未来几年中,越来越多的机器学习工作负载将变得司空见惯。

为了满足这一需求,ARM与富士通合作开发了可伸缩矢量扩展(Scalable Vector Extension, SVE)技术,并驱动了世界上最快的超级计算机“富岳”。在此基础上,ARM为ARMv9开发了SVE2,以便在更广泛的应用中实现增强的机器学习和数字信号处理能力。

除了增加的各种现代SIMD功能外,SVE和SVE2的优势还在于其可变的向量大小,范围覆盖了128b到2048b,让其无论在什么硬件运行,都允许向量的可变粒度为128b。

如果纯粹从向量处理和编程的角度来看,这意味着软件开发人员将只需要编译一次其代码,并且如果将来某个CPU带有本地的512b SIMD execution pipelines,该代码将能够充分利用单元的整个宽度。

同样,相同的代码将能够在具有较低硬件执行宽度能力的保守设计上运行,这对于ARM设计从物联网、移动到数据中心的CPU而言至关重要。在保留ARM体系结构的32b编码空间的同时,它还可以完成所有这些工作。然而,类似X86这样的架构,则需要根据矢量尺寸增加新的指令和扩展。

SVE2增强了对在CPU上本地运行的5G系统、虚拟和增强现实以及机器学习工作负载的处理能力,如:图像处理和智能家居应用。

在未来几年,ARM将进一步扩展其技术的AI能力,除了在其Mali GPU和Ethos NPU中持续进行AI创新外,还将大幅增强CPU内的矩阵乘法。

亮点三:通过系统设计实现性能最大化

在过去的五年,ARM技术每年都以超过业界的速度提升CPU性能。ARM在新一代架构ARMv9上将保持这个速度,预计未来两代移动和基础设施CPU的性能提升将超过30%。

据ARM官方称,这个数据是根据业界标准评测工具来衡量,30%的算力提升完全是凭借于本身架构,而不是借助于制程工艺来实现的。

然而,随着行业从通用计算向普遍的专用处理发展,每年两位数的CPU性能提升是不够的。除了增强专用处理能力,ARM的全面计算(Total Compute)设计方法,将通过集中的系统级硬件和软件优化以及用例性能的提高,加速总体计算性能。

通过将全面计算的设计原则应用在包含汽车、客户端、基础设施和物联网解决方案的整个IP组合中,ARMv9系统级技术将遍及整个IP解决方案,并改善个别IP。

此外,ARM还在开发多项技术以提高频率、带宽、缓存,并降低内存延迟,从而最大限度地提升基于ARMv9的CPU性能。

ARM欲打破x86垄断

目前,CPU领域最成功的架构当属x86,不过x86的成功和统治力在于PC和高性能计算市场,在ARM擅长的智能终端市场并不成功。

近几年,ARM架构在高性能计算领域取得了一些进展,包括上面提到的“富岳”超级计算机,以及推出采用ARM架构的多款服务器。

去年,苹果基于ARM架构推出M1处理器,并成功应用在Macbook Pro电脑上。

此外,高通、微软也在布局基于ARM架构的电脑处理器和系统。这一系列的举动,都让业界看到了x86架构在PC市场的统治地位并非牢不可破。

ARM首席执行官Simon Segars说,“ARM芯片实现1000亿颗的出货花了26年,如果预测准确,接下来一年,我们的合作伙伴出货的ARM芯片将累计达到2000亿颗。也就是说,我们的第二个1000亿的出货将在短短5年内达成。”

据媒体报道,目前ARM架构的芯片出货已经超过1800亿颗,ARMv9架构会成为实现ARM芯片3000亿颗芯片出货的先驱。

没有人能准确预估ARM实现第三个1000亿颗芯片出货的时间,但可以明确的是,ARM希望其芯片能够为所有智能计算提供算力,也就是让其芯片在未来无处不在。

现在看来,在复杂的国际形势下,同属精简指令集的RISC-V正在快速发展,加上x86阵营Intel和AMD也在加强x86的竞争力,ARM要真正撼动x86的优势领域并非易事。

华为能否获得ARMv9授权?

不过,相比于ARMv9到底更新了哪些功能,国内关注更多的还是华为能否获得ARMv9的授权。

据悉,华为自主研发的海思芯片就是基于ARM架构设计的。在美国出台芯片禁令之时,华为方面表示,已经获得了ARMv8架构授权,可以自主设计处理器,并掌握到核心技术。

虽然华为掌握着ARMv8架构,但没有最新构架的支持,华为也将陷入停滞不前的状态。

对于ARMv9是否以供给包括华为在内的中国企业的问题,ARM的官方回复是:

“ARM既有源于美国的IP,也有非源于美国的IP。经过全面的审查,ARM确定其ARMv9架构不受美国出口管理条例(EAR)的约束。

ARM已将此通知美国政府相关部门,我们将继续遵守美国商务部针对华为及其附属公司海思的指导方针。”

细品这番发言,ARM的态度实在是模棱两可:

第一,ARM官方没有说任何关于ARMv9可以授权给华为的事情。

第二,从ARM官网上可以看到,谷歌、英伟达、高通、小米、OPPO、VIVO、联发科、台积电都是ARM的合作伙伴,但是华为却不见踪影,可见这件事背后,还是有一些隐情。

换句话说,华为能否得到ARMv9的授权,其实还是一个未知数。

另一方面,即使华为得到v9的授权,但芯片制造依然是一个大问题。

同时,国内业界也在担忧,在ARM新架构之下,快速进军PC和服务器业务,这会对我国硬件国产化以及系统国产化带来更大压力。

0 人点赞