首款生成式AI移动芯片天玑9300:能跑330亿参数大模型

2023-11-13 15:54:03 浏览数 (1)

机器之心报道

作者:泽南

AI 画图一秒生成,大语言模型一秒 20 token。

2023 年是生成式 AI 的元年,我们手上的移动设备也在加速进入大模型时代。

11 月 6 日晚,联发科(MediaTek)正式发布了年度旗舰 SoC 天玑 9300,这款芯片通过 4 4 全大核的设计,在性能与能耗等方面,全面超越了安卓和苹果竞品。

更为值得关注的是,今年的旗舰芯片被定义为 5G 生成式 AI 移动芯片,提供了远超以往的高智能、高性能、高能效、低功耗卓越特性。

天玑 9300 采用台积电新一代 4nm 工艺,拥有 227 亿个晶体管。为了提供生成式 AI 时代的算力需求,天玑 9300 上开创性地使用了「全大核」CPU 架构,包含 4 个 Cortex-X4 超大核,最高频率可达 3.25GHz,以及 4 个主频为 2.0GHz 的 Cortex-A720 大核,其峰值性能相较上一代提升 40%,同性能情况下功耗节省 33%。

这种架构在保证了工作速度快、效率高的同时具有省电的特性,无论在轻载还是重载应用场景中,都能降低功耗、延长续航时间。联发科表示,天玑 9300 面向目前常用的视频、直播、游戏等常见任务需求进行了优化,相比以往也更加适应折叠屏手机的多任务模式。

随着芯片制程提升,晶体管正在不断小型化,各种漏电问题成为摩尔定律发展的重大障碍。漏电意味着能量消耗的大幅增加,芯片也会面临过热甚至失效的问题。在这种情况下,小核心的功耗与大核心差距已越来越小。

据介绍,早在三年前联发科就开始了全大核芯片形式的探索。现在,让大核快速处理任务后进行较长时间的休眠,我们可以让大核处理器反直觉地相比小核同类产品更加省电。另一方面,联发科也加入了乱序执行(out-of-order)策略,进一步增加了应用执行的效率。

联发科认为到明年,全大核的设计将成为业内的共识。

常规能力之外,联发科本次着重升级了芯片的 AI 性能。天玑 9300 集成了 MediaTek 第七代 AI 处理器 APU 790,专为生成式 AI 而设计,其性能和能效相较上一代得到显著提升,整数运算和浮点运算的性能是前一代的两倍,功耗降低了 45%。

APU 790 内置了硬件级的生成式 AI 引擎,可实现更加高速且安全的边缘 AI 计算,相比上代,它专门针对目前大语言模型常用的 Transformer 进行算子加速,大模型的处理速度是上一代的 8 倍。

当代流行的大语言模型(LLM),其主要核心网络架构大多是由 transformer Block 组成的。相较于计算机视觉常见的 CNN 网络,transformer 网络以 Softmax LayerNorm 算子作为核心,卷积算子较少,因此原先 AI 核心的加速机制并不适用。在第七代 APU 处理器上,联发科着重优化 Softmax LayerNorm 算子,提升了算力。

量化是目前优化 AI 推理的有效方式之一。基于亿级参数大语言模型特性,联发科开发了混合精度 INT4 量化技术,结合其特有的内存硬件压缩技术 NeuroPilot Compression,可以更高效地利用内存带宽,大幅减少 AI 大模型对终端内存的占用。

联发科的工程师表示,虽然大模型可以带来更好的生产力,但本地运行 13B 的体量就意味着需要占用约 13GB 的内存,再加上安卓本身的 4GB,其他 APP 的 6GB,已经超过了大多数手机 16G 的内存容量。天玑 9300 使用的内存硬件压缩技术,通过量化和压缩把大模型的内存占用降低到了 5GB,只有这样才能让大多数用户在日常跑得起大模型应用。

APU 790 还支持生成式 AI 模型端侧「技能扩充」技术 NeuroPilot Fusion,可以基于基础大模型持续在端侧进行低秩自适应(LoRA,Low-Rank Adaptation)融合,进而赋予基础大模型更加全面的能力。

基于这样的硬件和优化,天玑 9300 在苏黎世联邦理工提出的 AI Benchmark 最新版本上可以达到 2019 分,是移动芯片的新高。

使用天玑 9300,端侧的 AI 图片生成如 Stable Diffusion 可以做到一秒以内出图,70 亿参数大语言模型的端侧推理可以做到每秒 20token。

联发科表示在与 vivo 的合作中,基于天玑 9300 已经率先实现了 7B 和 13B 大模型在移动端的推理,预计不久之后在终端就可以看到这样的产品推向市场。另外在更极限的情况下,联发科还跑通了高达 33B 的大模型。

在发布之前的沟通会和现场,联发科展示了使用天玑 9300 工程机实现的 LoRA 文生图、大模型生成文字等能力。

我们可以预见,在最新一代旗舰手机上,我们可以用上更聪明的智能助手,根据大模型给出的建议快速回复聊天和右键,用 AI 生成的表情包斗图……

马上就会推出且人人都可以体验到的,就是 vivo X100 系列手机上 OriginOS 4 系统里的 AI 助理蓝心小 V。

本月初,vivo 刚在开发者大会上介绍了蓝心大模型及其应用,这一系列能力显然是面向手机的。在大模型的加持下,蓝心小 V 拥有行业领先的智慧,它可以通过语音、文字、文件拖拽等方式接收信息进行处理。如果遇到简单的问题,小 V 会以文字或图片进行回复。面对复杂的问题,它还可以通过 SWOT 模型或思维导图的形式输出回答。

此外,天玑 9300 的 AI 能力还覆盖从搜索到拍摄。

联发科表示,其 AI 开发平台 NeuroPilot 已经对安卓、LIama 2、文心一言、百川大模型等前沿主流 AI 大模型进行了深度适配和优化,更多应用也在路上。

GPU 方面,天玑 9300 采用了 12 核心的 Immortalis-G720。与上代相比峰值性能提升 46%,相同性能下功耗可节省 40%。天玑 9300 搭载 MediaTek 第二代硬件光线追踪引擎,支持 60FPS 高流畅度的光线追踪,并带来游戏主机级的全局光照特效。

此外,MediaTek 特有的 MAGT 游戏自适应调控技术升级为「星速引擎」,不仅与游戏应用广泛合作,还将拓展更多类型应用的生态合作。在活动中,联发科宣布天玑 9300 平台将首发《仙剑世界》光追版,同时也将在手游《暗区突围》上实现稳定 60 帧光追的体验。

目前根据很多第三方评测,天玑 9300 工程机的 CPU、GPU 绝对性能和功耗比均超过了骁龙 8Gen3 与 A17Pro,看起来使用全大核的策略是成功的。

图片来源:极客湾 Geekerwan

在其他方面,天玑 9300 也进行了全面升级,其 ISP 升级到了 Imagiq 990,支持 AI 语意分割视频引擎、16 层图像语意分割、景深和光斑双引擎、全像素对焦叠加 2 倍无损变焦、OIS 光学防抖专核、3 麦克风高动态录音降噪,可过滤 25km/h 风速的 99% 以上风噪。

天玑 9300 还配备了新的安全启动芯片、隔离的安全计算环境和 Armv9 的内存标记扩展,可帮助开发人员避免内存漏洞利用。

网络方面,天玑 9300 集成了 5G 调制解调器支持 Sub-6GHz 四载波聚合(4CC-CA)和多制式双卡双通,也通过 AI 算法提升信号,支持 5G 情境感知功能。天玑 9300 支持 Wi-Fi 7 和 5G sub-6GHz 频段,下行链路速率达到 7Gbps。在蓝牙连接方面,天玑 9300 支持 3 个蓝牙天线、特有双路蓝牙闪连技术,可以带来超低时延的蓝牙音频体验。

据介绍,首款采用天玑 9300 芯片的手机包含 vivo、OPPO、小米、传音等。在联发科的发布活动后,vivo 已宣布即将在 11 月 13 日发布的 X100 系列中率先搭载新旗舰芯片,并第一个实现 LPDDR5T-9600 内存的落地。

我们期待新一代产品的问世。

© THE END

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

0 人点赞