NVIDIA Jetson Orin NANO模组发布,会是大冤种么?

2022-09-26 17:43:05 浏览数 (1)

20229月GTC大会,NVIDIA CEO黄仁勋发布了Jetson Orin NANO模组。终于让大家吃了一个定心丸:Jetson NANO产品后继有“芯”了!

但是,请注意,本次发布的是模组,不是开发套件,而且按照NVIDIA在后续GTC的讲座里,NVIDIA应该不会出Orin NANO开发套件了!

让我们看看Jetson Orin NANO与Jetson NANO相比,到底差异在哪里。

Jetson Orin NANO规格

不同于Jetson NANO只有一个4GB版本,NVIDIA将推出两个版本:Jetson Orin Nano 4GB 和 Jetson Orin Nano 8GB。

相较于Jetson NANO模组 99美金,Jetson Orin NANO模组的价格提高了至少100美金。还记得Orin系列其他模组的价格么?让我们帮助你回忆一下:

对比中高端的Orin家族模组Orin NX和AGX Orin,作为Orin家族的入门级模组,Orin NANO的价格还是很有竞争力的。

不过小编在想,会不会有人觉得,对于Orin NANO 8GB模组,我只需要再加100美金,就可以使用更高端的Orin NX模组了?

如上图为Jetson Orin Nano 8GB 的 架构,Jetson Orin Nano 4GB 有 2 个 TPC 和 4 个 SM。

Jetson Orin Nano 展示了带有 NVIDIA Ampere 架构 GPU 的 NVIDIA Orin 架构。Orin NANO 8GB 有多达 8 个流式多处理器 (SM),由 1024 个 CUDA 核心和多达 32 个用于 AI 处理的Tensor Core组成。NVIDIA 安培架构第三代Tensor Core提供比上一代更好的每瓦性能,并通过支持稀疏性带来更高的性能。借助稀疏性,您可以利用深度学习网络中的细粒度结构化稀疏性,将 Tensor Core 操作的吞吐量提高一倍。为了加速应用程序管道的所有部分,Jetson Orin Nano 还包括一个 6 核 Arm Cortex-A78AE CPU、视频解码引擎、ISP、视频图像合成器、音频处理引擎和视频输入模块。

Jetson Orin Nano 模块在其小型 70x45mm 260 针 SODIMM 占用空间内包括各种高速接口:

-多达 7 个 PCIe Gen3 通道

-三个高速 10-Gbps USB 3.2 Gen2 端口

-八通道 MIPI CSI-2 摄像头端口

-各种传感器 I/O

请注意,有人会问Jetson Orin NANO兼容现有的载板么?NVIDIA在文档里只是说明了Jetson Orin Nano 和 Jetson Orin NX 模块完全兼容引脚和外形尺寸。

Jetson入门模组规格比较

为了更好体现Jetson Orin NAN模组的规格,我们把整个几款Jetson 入门模组的规格做个横向比较

从表格里,我们可以看出:

  1. Orin NANO是支持FP16和Int 8,而NANO只支持FP16。经过推算,我们可以看出Orin Nano 4GB有1.25TFlops的FP32 (SP),1.25TFops的FP16(SP), 5TFlops的FP16(TensorCore), 和10TFlops的INT8(TensorCore),相较于Jetson NANO FP16(纯SP)才0.5TFLOPS(500个G),有了1个数量级的提升,很是惊人!!从另外的角度说,199美金还是真值的。
  2. Orin NANO的CPU为A78AE,这个可真心比老Nano的A57强很多。我们用50%计算好了,都是1.5Ghz的频率,从4核心A57,变成了6核心A78AE,应当有6 / 4 * 150% = 2.25X的CPU性能提升。虽然CPU性能没有提升到像GPU那样的10X-20X,但是也很不错(你别忘记功耗啊,这么低的情况下),要知道推理的前后处理,一般都依赖CPU。
  3. Orin NANO的内存带宽,其实没有提高多少。对比TX2NX的51.2GB/S,同样是4GB,Orin NANO也只是34GB/S,只比Jetson NANO的 25.6GB/S提高了一丢丢。从这个角度上看,Orin NANO 4GB的Memory性能和容量反而可能成为瓶颈了,因为CPU和GPU都提升好多(特别是GPU)。然而内存才提升了32.8%(25.6GB/s -> 34GB/s),给跑实际应用的人带来了更大的挑战。因为你在新平台上很可能卡在内存瓶颈上,而不容易发挥出来GPU的那么高的提升,和CPU比较高的提升。
  4. Orin NANO没有eMMC了!直接通过外部NVME来做数据存储。这个对于严格的工业用途可能会有一点点伤。
  5. Orin NANO编码能力有了一个很大的改变,需要1-2个CPU核心来支持1080p/30帧速率的编码。看来NV不喜欢在边缘端将数据编码后,回传数据中心了。消除了编码能力,等于鼓励人们尽量就地解决了(也就是尽量边缘计算了),可以理解,因为前一种玩法,一个渣RK3399都可以编码后,回传数据中心再分析。后一种玩法,这样只有NV才能玩得起。其他家都没有这么大的算力。这样,避免同质化被替换,避免客户将边缘端随意地替换成其他家的产品。

所以相较之下,老黄的刀法依旧精湛!

问题来了——

  1. Orin NANO什么时候可以买到?

答:NVIDIA官宣2023年1月份会上市

2. Orin NANO会出开发套件么?

答:NVIDIA应该不会出Orin NANO开发套件了。

3. 我如何买到Orin NANO系统?大概多少钱?

答:届时会有第三方公司用Orin NANO模组推出整机系统或者开发套件。大家可以耐心等待。按照Orin NANO 4GB模组199美金来计算,国内的模组价格会在1260元左右(以现在的汇率估算),加上载板、电源、散热片等,肯定要2500元以上了。

4.Orin NANO模组兼容现在的Jetson NANO官方开发套件的载板么?

答:可能可以插上,但是可能有些新功能用不了。

最后放上一张Jetson Orin家族的Roadmap

多多关注我们的视频号吧!

0 人点赞