9月20日晚间,英伟达(NVIDIA)正式发布了全新的RTX 40系列显卡,首发推出的有三款型号,分别是RTX 4090、RTX 4080 16GB、RTX 4080 12GB,将于10月12日上市,建议零售价12999元起。
与此同时,NVIDIA还针对汽车市场发布了全新的自动驾驶芯片——Thor(雷神索尔),其算力达到了惊人的2000TFLOPS,是目前Orin芯片的8倍。
RTX 40系列基于全新设计的Ada Lovelace GPU架构,在性能、效率上都实现了巨大的代际飞跃,无论是实时光线追踪,还是AI神经网络渲染,都可以说开启了新时代。
RTX 40系列的主要创新提升有:
1、流式多处理器(SM)
着色器能力高达83TFlops(83万亿次运算每秒),吞吐量超过上一代产品的2倍。
2、第三代RT Cores光追核心
有效光追算力达到191TFlops(每秒191万亿次运算),是上一代产品的2.8倍,光线与三角形求交性能是上代的2倍。
同时,并加入两个全新的重要硬件单元:一是Opacity Micromap引擎,可将光追的Alpha-Test几何性能提升2倍;二是Micro-Mesh引擎,可动态生成微网格、产生额外的几何图形,提升几何图形丰富度的同时,不会像传统复杂几何图形处理那样牺牲性能、存储成本。
NVIDIA还以《赛博朋克2077》为例,号称RTX 40系列可对每个像素执行超过600次的光追计算来确定光照,比四年前的首批光追游戏增加了多达16倍。
3、第四代Tensor Cores张量核心
FP8张量处理性能高达1.32PFlops(每秒1320万亿次运算),超过上一代使用FP8加速性能的5倍。
4、支持着色器执行重排序(SER)
通过即时重新安排着色器负载,提高执行效率,更好地利用GPU资源,为光追带来最高3倍的性能提升,整体游戏性能提升也可达25%。
NVIDIA声称,该技术的创新力度,堪比CPU处理器的乱序执行。
5、集成光流加速器
带来2倍的性能提升,搭配DLSS 3可以预测场景中的运动,神经网络保持图像质量的同时提高帧率。
6、支持DLSS 3
在RTX 40系列显卡、第四代Tensor Core张量核心、光流加速器的硬件基础上,支持开创性的光学多帧生成。
其革命性之处在于,它可以直接生成全新的完整帧画面,而不仅仅是单个像素点,通过使用光流加速器分析两帧连续的游戏图像,计算帧到帧之间物体、元素的运动矢量数据。
结合DLSS生成全新帧、DLSS超级分辨率帧,DLSS 3能用AI重建多达7/8的显示像素,与没有DLSS相比游戏可性能提升4倍。
DLSS 3首发已经/即将支持36款游戏、3款游戏引擎、2款应用,包括《黑神话:悟空》、《逆水寒》、《永劫无间》、《仙剑奇侠传7》等国产游戏。
6、集成两个第八代NVIDIA编码器(NVENC)
输出时间至多缩短一半,并支持AV1视频格式编解码,得到了OBS、Blackmagic Design DaVinci Resolve、Discord等公司的采纳。
NVIDIA Broadcast软件开发工具包也有三个更新,包括面部表情预估、眼神追踪、虚拟绿幕质量改进
8、能耗比提升2倍
架构改进结合台积电N4 4nm定制工艺技术,能耗比提升2倍。
具体规格和售价:
RTX 4090:
作为RTX 40系列的旗舰产品,RTX 4090集成760亿个晶体管、16384个CUDA核心,搭配美光的24GB GDDR6X显存。
功耗和RTX 3090 Ti一样都是450W,但号称游戏性能提升2倍,DLSS 3游戏性能提升4倍,同时在4K游戏中也能获得100FPS以上的帧率。
10月12日上市,建议零售价12999元起。
相比之下,RTX 3090首发价为11999元起,RTX 3090 Ti首发则是14999元起。
RTX 4080 16GB:
9728个CUDA核心,搭配美光的16GB GDDR6X显存,游戏性能2倍于RTX 3080 Ti,并超过RTX 3090 Ti。
11月上市,建议零售价9499元起。
这对比RTX 3080 5499元首发价自然是贵了太多,但它的定位实际上是在RTX 3080 Ti的层级,后者首发8999元。
RTX 4080 12GB:
据说就是原定的RTX 4070 Ti,7680个CUDA核心,美光的12GB GDDR6X显存,性能也可以超越上代卡皇RTX 3090 Ti。
11月上市,建议零售价7199元起。
这个价格确实有点高,但上一代RTX 3080 Ti 8999元、RTX 3080 5499元之间的空档也有点大,这次算是补上了。
从这样的产品和价格布局上看,RTX 40系列将是发烧友的首选,RTX 30系列则适合主流玩家。
合作伙伴方面,华硕、七彩虹、耕升、影驰、技嘉、映众、微星、索泰等顶级显卡品牌厂商也都将陆续推出RTX 4090、RTX 4080系列显卡,包括标准版、超频版。
NVIDIA也会限量推出RTX 4090、RTX 4080 16GB FE公版。
宏碁、外星人、华硕、戴尔、惠普、联想、微星等则会推出预装RTX 40系列显卡的OEM整机产品。
2000TFLOPS!NVIDIA发布最强汽车芯片
除了发布RTX 40系列显卡之外,NVIDIA昨晚还针对汽车市场发布了全新的自驾芯片——Thor(雷神索尔),其算力达到了惊人的2000TFLOPS,是目前Orin芯片的8倍。
NVIDIA去年发布了Orin迭代升级的自驾芯片Altan,性能从Orin的275TFLOPS大幅提升到了1000TFLOPS,原本预定2024年上市,然而NVIDIA现在推出了Thor芯片,直接替代了Altan,Altan也会被取消,不再上市。
取代Altan的Thor芯片自然是规格、性能更好更强大,这颗超级SoC支持了新的FP8数据格式,性能达到了2000TFLOPS,是Altan的2倍,是Orin的8倍,很多汽车公司会使用多颗Orin,现在一颗就能顶8颗。
Thor是一颗超级强大的SoC芯片,CPU部分来自于NVIDIA的Grace,GPU有Hopper及Ada的技术。
NVIDIA并未公布Thor芯片的工艺制程,但透露其集成了770亿颗晶体管,比RTX 4090显卡还要多10亿颗,仅比即将推出的针对数据中心市场的4nm的H100芯片少了30亿晶体管。猜测Thor可能也是基于台积电4nm工艺。
Thor实际上不仅仅是用于自动驾驶,由于2000TFLOPS的性能实在太强了,它可以接管自驾及智能座舱等系统,而且可以同时驱动Linux、QNX 和 Android系统,以往有多个系统/芯片负责的功能都可以在Thor上实现。
据介绍,Thor芯片将于2025年上市,首发客户是极氪,新车型也会在2025年上市。
编辑:芯智讯-浪客剑 综合自快科技