Bleeding-edge 7nm process
苹果始终使用最好的制造工艺来生产其芯片(几乎一直是台积电)。A13 Bionic也不例外。它是最早使用台积电第二代7纳米新工艺的公司之一。它类似于去年在A12 Bionic和AMD Ryzen 3000系列等处理器中使用的7nm工艺。
第二代工艺有时被称为7nm 或7NP,使用紫外光刻(EUV)蚀刻芯片层。这意味着晶体管更小,更紧凑,从而其漏电更少性能更好。
台积电的第二代7纳米工艺使用部分EUV技术来制造更快,更省电的晶体管。
这意味着在相同的空间中有更多的晶体管,但是在相同的功耗下,时钟速度更快,或者在相同的时钟速度下,功耗会更低。这正是我们在A13 Bionic中看到的。
苹果在A13中塞满了85亿个晶体管,比A12增长了23%。Die 的面积大了约20%,约为98平方毫米,而A12为83平方毫米。因此,Apple在芯片的密度变化不大,但是在性能和功效方面却实现了大幅提高。
但是,这不是苹果有史以来最大的芯片。新款iPad Pro中的A12X具有更多的晶体管(100亿个),估计约为135mm²,而A5和A10 Fusion都超过120mm²。
The fastest CPU gets faster
Apple的定制CPU设计通常比任何竞争的智能手机芯片都能提供更快的单核性能,尽管在谈论完全不同的平台时很难依靠基准。多核性能也很难被击败。
A13 Bionic延续了这一传统。苹果表示,其两个大型高性能CPU内核和四个节能CPU内核均比A12快20%。
CPU性能是企业中最好的。
在现实世界中,几乎从来没有真正看到过最大的理论性能提升的用例,但是我们的benchmarks测试显示,单核的CPU性能几乎提高了20%,而多核性能甚至更高。
与去年同期相比,这是一个了不起的提高,对于高通,三星等公司来说,要与之匹敌是一个很大的挑战。
Catching up and pulling ahead in GPU performance
如果在竞争的智能手机处理器领域能够击败苹果,那就是GPU。Apple的GPU提供的实际性能是业界最好的,但在某些跨平台benchmarks测试中跑不过anroid 手机如Quallcomm 的芯片。
A13中的GPU仍然是Apple的定制四核设计,Apple称其为“metal optimized”,速度提高了20%。在我们的测试中,它比这快得多。Geekbench使用GPU上的Metal API的计算性能,在Geekbench 4和Geekbench 5中都快了40%。
我们进行的3DMark Fire Strike测试速度提高了50%到60%(这是现代高端3D游戏性能的良好衡量标准)。较早的3DMark Ice Storm Unlimited的运行速度快了近30%;苹果的芯片已经在这个测试中一直处于竞争中,并且在这一点上还处于领先地位。
如果将GPU计算性能与游戏级3D基准结合起来,可以说苹果目前是智能手机中最快的GPU。
有趣的是,我们看到的实际性能远远超过了苹果提出的20%的改进要求。很难知道是什么原因造成的,这可能是内存带宽导致的,而不是GPU 理论上的峰值。
苹果声称A12提供的GPU性能比A11快50%,但我们没有看到任何东西-一些测试根本没有显示任何真正的改进。当时,我们猜测内存带宽的限制使芯片无法在某些3D图形测试中达到其最高的理论性能。也许今年,尽管该芯片的速度没有快50%,但它能够更好地利用可用的内存带宽。
不管是什么原因,Apple都实现了比承诺的GPU性能提高20%。
Better power efficiency
与A13 Bionic的性能改进一样令人印象深的就是能效的提高。苹果表示,A13的GPU和高效CPU内核的功耗降低了40%,而高性能CPU内核的功耗降低了30%,而神经引擎的功耗降低了15%。
当A13的部件以与A12相同的速度运行时,它们会消耗更少的功率。当它们运行得更快时,功耗将大大减少。
iPhone 11的电池寿命大约等于iPhone XR(尽管要快得多)。在实际的日常使用中,我们发现其使用寿命更长。
苹果表示,这部分是通过拥有数百个电压域以降低不使用时芯片主要部件的功率,以及数十万个时钟门控域来禁用不使用的逻辑门来实现的。这听起来令人印象深刻,但老实说,这是现代顶级芯片设计的相当标准的一部分。也许苹果公司在这些设计元素上比竞争产品要走得更远-没有确切的数字是不可能知道的-但这不应该被视为一项特殊的新创新。
电压和时钟域确保在这一精确的微秒内未使用的芯片部分不会浪费任何功率。
A13的每瓦性能比A12好很多。尽管具有相似大小的电池,相同的显示屏并提供了更高的性能,但在我们的Geekbench 4恒定基准电池测试中,iPhone 11的使用寿命与iPhone XR一样长。在日常使用中,电池使用寿命更长,这也许是所有电池中最好的指示器。在iPhone 11临持续了很多比iPhone XS更长的时间,但是这不是仅仅是由于更有效的A13芯片的显示也更为高效,并且电池是很多大。
Made for Machine Learning
今年,CPU有一个新技巧:一组“机器学习加速器”,它们执行矩阵乘法运算的速度比单独的CPU快六倍。目前尚不清楚如何精确地访问此硬件(它们是ARMv8指令集的扩展,例如Intel的AVX是x86的扩展吗?),但是对于像机器学习(ML)这样使用大量矩阵运算的任务,CPU是强大的工具。请注意,此矩阵乘法硬件是CPU内核的一部分,与神经引擎硬件分开。
与芯片中的所有其他功能一样,神经引擎的运行速度比以前快了20%(就好像设计相对不变,新的7nm 工艺使时钟速度提高了20%)。
苹果公司称GPU是“metal optimized”,GPU可能是也可能不是新设计,但在我们的测试中使用Metal API可以提供更快的计算性能。
芯片中有一个机器学习控制器,可以自动调度CPU,GPU和Neural Engine之间的机器学习操作,因此开发人员不必自己平衡负载。