英伟达RTX 40系列显卡发布!还有最强汽车芯片Thor:算力高达2000TFLOPS!

2022-09-27 11:08:52 浏览数 (1)

9月20日晚间,英伟达(NVIDIA)正式发布了全新的RTX 40系列显卡,首发推出的有三款型号,分别是RTX 4090、RTX 4080 16GB、RTX 4080 12GB,将于10月12日上市,建议零售价12999元起。

与此同时,NVIDIA还针对汽车市场发布了全新的自动驾驶芯片——Thor(雷神索尔),其算力达到了惊人的2000TFLOPS,是目前Orin芯片的8倍。

RTX 40系列基于全新设计的Ada Lovelace GPU架构,在性能、效率上都实现了巨大的代际飞跃,无论是实时光线追踪,还是AI神经网络渲染,都可以说开启了新时代。

RTX 40系列的主要创新提升有:

1、流式多处理器(SM)

着色器能力高达83TFlops(83万亿次运算每秒),吞吐量超过上一代产品的2倍。

2、第三代RT Cores光追核心

有效光追算力达到191TFlops(每秒191万亿次运算),是上一代产品的2.8倍,光线与三角形求交性能是上代的2倍。

同时,并加入两个全新的重要硬件单元:一是Opacity Micromap引擎,可将光追的Alpha-Test几何性能提升2倍;二是Micro-Mesh引擎,可动态生成微网格、产生额外的几何图形,提升几何图形丰富度的同时,不会像传统复杂几何图形处理那样牺牲性能、存储成本。

NVIDIA还以《赛博朋克2077》为例,号称RTX 40系列可对每个像素执行超过600次的光追计算来确定光照,比四年前的首批光追游戏增加了多达16倍。

3、第四代Tensor Cores张量核心

FP8张量处理性能高达1.32PFlops(每秒1320万亿次运算),超过上一代使用FP8加速性能的5倍。

4、支持着色器执行重排序(SER)

通过即时重新安排着色器负载,提高执行效率,更好地利用GPU资源,为光追带来最高3倍的性能提升,整体游戏性能提升也可达25%。

NVIDIA声称,该技术的创新力度,堪比CPU处理器的乱序执行。

5、集成光流加速器

带来2倍的性能提升,搭配DLSS 3可以预测场景中的运动,神经网络保持图像质量的同时提高帧率。

6、支持DLSS 3

在RTX 40系列显卡、第四代Tensor Core张量核心、光流加速器的硬件基础上,支持开创性的光学多帧生成。

其革命性之处在于,它可以直接生成全新的完整帧画面,而不仅仅是单个像素点,通过使用光流加速器分析两帧连续的游戏图像,计算帧到帧之间物体、元素的运动矢量数据。

结合DLSS生成全新帧、DLSS超级分辨率帧,DLSS 3能用AI重建多达7/8的显示像素,与没有DLSS相比游戏可性能提升4倍。

DLSS 3首发已经/即将支持36款游戏、3款游戏引擎、2款应用,包括《黑神话:悟空》、《逆水寒》、《永劫无间》、《仙剑奇侠传7》等国产游戏。

6、集成两个第八代NVIDIA编码器(NVENC)

输出时间至多缩短一半,并支持AV1视频格式编解码,得到了OBS、Blackmagic Design DaVinci Resolve、Discord等公司的采纳。

NVIDIA Broadcast软件开发工具包也有三个更新,包括面部表情预估、眼神追踪、虚拟绿幕质量改进

8、能耗比提升2倍

架构改进结合台积电N4 4nm定制工艺技术,能耗比提升2倍。

具体规格和售价:

RTX 4090:

作为RTX 40系列的旗舰产品,RTX 4090集成760亿个晶体管、16384个CUDA核心,搭配美光的24GB GDDR6X显存。

功耗和RTX 3090 Ti一样都是450W,但号称游戏性能提升2倍,DLSS 3游戏性能提升4倍,同时在4K游戏中也能获得100FPS以上的帧率。

10月12日上市,建议零售价12999元起。

相比之下,RTX 3090首发价为11999元起,RTX 3090 Ti首发则是14999元起。

RTX 4080 16GB:

9728个CUDA核心,搭配美光的16GB GDDR6X显存,游戏性能2倍于RTX 3080 Ti,并超过RTX 3090 Ti。

11月上市,建议零售价9499元起。

这对比RTX 3080 5499元首发价自然是贵了太多,但它的定位实际上是在RTX 3080 Ti的层级,后者首发8999元。

RTX 4080 12GB:

据说就是原定的RTX 4070 Ti,7680个CUDA核心,美光的12GB GDDR6X显存,性能也可以超越上代卡皇RTX 3090 Ti。

11月上市,建议零售价7199元起。

这个价格确实有点高,但上一代RTX 3080 Ti 8999元、RTX 3080 5499元之间的空档也有点大,这次算是补上了。

从这样的产品和价格布局上看,RTX 40系列将是发烧友的首选,RTX 30系列则适合主流玩家。

合作伙伴方面,华硕、七彩虹、耕升、影驰、技嘉、映众、微星、索泰等顶级显卡品牌厂商也都将陆续推出RTX 4090、RTX 4080系列显卡,包括标准版、超频版。

NVIDIA也会限量推出RTX 4090、RTX 4080 16GB FE公版。

宏碁、外星人、华硕、戴尔、惠普、联想、微星等则会推出预装RTX 40系列显卡的OEM整机产品。

2000TFLOPS!NVIDIA发布最强汽车芯片

除了发布RTX 40系列显卡之外,NVIDIA昨晚还针对汽车市场发布了全新的自驾芯片——Thor(雷神索尔),其算力达到了惊人的2000TFLOPS,是目前Orin芯片的8倍。

NVIDIA去年发布了Orin迭代升级的自驾芯片Altan,性能从Orin的275TFLOPS大幅提升到了1000TFLOPS,原本预定2024年上市,然而NVIDIA现在推出了Thor芯片,直接替代了Altan,Altan也会被取消,不再上市。

取代Altan的Thor芯片自然是规格、性能更好更强大,这颗超级SoC支持了新的FP8数据格式,性能达到了2000TFLOPS,是Altan的2倍,是Orin的8倍,很多汽车公司会使用多颗Orin,现在一颗就能顶8颗。

Thor是一颗超级强大的SoC芯片,CPU部分来自于NVIDIA的Grace,GPU有Hopper及Ada的技术。

NVIDIA并未公布Thor芯片的工艺制程,但透露其集成了770亿颗晶体管,比RTX 4090显卡还要多10亿颗,仅比即将推出的针对数据中心市场的4nm的H100芯片少了30亿晶体管。猜测Thor可能也是基于台积电4nm工艺。

Thor实际上不仅仅是用于自动驾驶,由于2000TFLOPS的性能实在太强了,它可以接管自驾及智能座舱等系统,而且可以同时驱动Linux、QNX 和 Android系统,以往有多个系统/芯片负责的功能都可以在Thor上实现。

据介绍,Thor芯片将于2025年上市,首发客户是极氪,新车型也会在2025年上市。

编辑:芯智讯-浪客剑 综合自快科技

0 人点赞