原来你是这样的GPU卡|NVIDIA发布新一代Titan系列:Titan RTX

2018-12-24 16:38:24 浏览数 (1)

今天,NVIDIA发布了目前世界上最强大的桌面GPU卡—— Titan RTX™,该卡采用NVIDIA 图灵™架构,可提供130 Tflops 深度学习计算性能和11 GigaRays光线追踪性能。

NVIDIA TITAN RTX功能亮点:

  • 576个多精度Turing Tensor Cores,提供高达130万亿次的深度学习性能。
  • 72个Turing RT Cores,每秒提供多达11 GigaRays实时光线跟踪性能。
  • 24GB高速GDDR6内存,672GB/s带宽——是上一代泰坦gpu卡显存的两倍——以适应更大的模型和数据集。
  • 100GB/s NVIDIA NVLink可以对两个TITAN RTX gpu实现显存和计算能力的扩张。
  • 难以置信的性能和内存带宽可以实现实时8K视频编辑。
  • VirtualLink™接口提供了所需的性能和连接下一代VR耳机。

第三方媒体提供了一个规格比较图:

那么问题来了,到底该选择怎样的GPU卡用于深度学习?

RTX2080ti跟Titan RTX都采用了TU102芯片,但是比2080Ti多了256个SP (或者说都是TU102,但是2080Ti屏蔽了一些SP),比2080Ti占优势的一个最大亮点是——24GB大显存!以前双11GB显存的2080Ti 上NVLink是为了什么!现在直接双倍显存还多。价格2499美元,比买2个2080ti还便宜。

不过Titan RTX双精度计算能力很渣,看来Titan-V还能再战斗一段时间。

第三方媒体还公布了一个图来展现图灵架构Tensor Core的性能关系:

注意:Titan V没有NVLink ,没有二代的Tensor Core (INT8和INT4的巨大加速),显存容量还不如人家,唯一优势就是双精度计算,不过Titan-V是HBM(HBM2实际上),这显存省电的很。

网上有人测试过说2080Ti的Tensor Core,在FP16计算的时候,如果最后是累加FP32的话,只有一半性能。纯FP16计算2080Ti无此问题。而纯FP16,和FP16/FP32混合精度,Titan RTX都没这个问题。比较符合上图所描绘的情况。如果这个情况是属实,家用卡的RTX系列,Tensor Core被限定了在混合精度计算的时候,性能只有1/2的话,深度学习的开发者就真的只能用专业卡或者Titan RTX 。关于这一点我们目前还没有机会拿到这两种卡做测试。

总结:

(1)NV现在主要靠显存容量区分了。Titan RTX适合需要大容量显存的应用场合。

(2)相比之前的Titan-V,Titan RTX支持NVLink。这应该是目前能买到的比较实际的,能聚合成48GB总容量的卡了。(2080Ti才能聚合成22GB,而Titan-V不能聚合)

(3)计算性能几乎没啥增长。对于需要强力计算性能的人来说,可以考虑继续使用RTX 2080Ti的卡,就慢一点点。

(4)网上有谣传说是RTX 2080 Ti屏蔽掉了Tensor Core在特定情况下的1/2的计算性能。而Titan RTX无此影响。

(5)因为计算性能无增长(几乎),游戏玩家,以前玩不动的光追游戏,现在依然玩不动。可以继续等待下一代的卡。

(6)Titan RTX没有双精度,也没有低功耗的HBM2显存。是一个遗憾。

0 人点赞