NVIDIA推出的NVIDIA Transfer Learning工具包(TLT)主打“无需AI框架方面的专业知识,即可为智能视频分析和计算机视觉创建准确而高效的AI模型。像零编码的专业人士一样发展。”
Transfer Learning Toolkit(TLT)是一个基于python的AI工具包,用于获取专门构建的预先训练的AI模型并使用您自己的数据进行自定义。迁移学习将学习到的特征从现有的神经网络提取到新的神经网络。当创建大型训练数据集不可行时,经常使用迁移学习。开发智能视觉AI应用程序和服务的开发人员,研究人员和软件合作伙伴可以将自己的数据用于微调经过预先训练的模型,而无需从头开始进行培训。
生产质量的预训练模型
针对特定用例(例如建筑物占用分析,交通监控,停车管理,车牌识别,异常检测等),NVIDIA竟然已经帮你准备好了预训练模型,避免开发者从头开始创建和优化模型的耗时过程,从而让你将工程工作从80周减少到大约8周,从而在较短的时间内实现更高的吞吐量和准确性。通过使用DeepStream部署视觉AI应用程序,您可以释放更大的流密度并进行大规模部署。
预先训练的模型可加速AI训练过程,并从头减少与大规模数据收集,标记和训练模型相关的成本。NVIDIA专门构建的预训练模型具有高质量的生产质量,可用于各种用例,例如人数统计,车辆检测,交通优化,停车管理,仓库运营等。
让我们来撸一撸这些预训练好的模型:
PeopleNet
确定人流,多用于运营零售店、商场和公共交通站点。PeopleNet是一个三级目标检测网络,它使用960x544 RGB图像来检测人、包和脸。
访问:
https://ngc.nvidia.com/catalog/models/nvidia:tlt_peoplenet
TrafficCamNet
了解交通交叉口周围的交通流,并在交通拥堵期间优化交通,TrafficCameNet是一种4级对象检测网络,在960x544 RGB图像上进行训练,可检测汽车,两个轮车,人和道路标志。
访问:https://ngc.nvidia.com/catalog/models/nvidia:tlt_trafficcamnet
VehicleMakeNet
汽车分类模型可用于常见的智慧城市应用,例如交通路口,安全出入口,购物中心停车管理和收费站监控。分类网络基于ResNet18,可将224 x 224尺寸的汽车作物分为20种汽车,包括,歌,奥迪,宝马,雪佛兰,克莱斯勒,道奇,福特,GMC,本田,现代,英菲尼迪,吉普,起亚,雷克萨斯,马自达,梅赛德斯,日产,斯巴鲁,丰田和大众。CarMakeNet可以通过DashCamNet或TrafficCamNet进行流水线传输,以实现智能城市应用。
访问:
https://ngc.nvidia.com/catalog/models/nvidia:tlt_vehiclemakenet
DashCamNet
基于NVIDIA的detectnet_v2架构构建的4类对象检测网络,其中ResNet18作为主干特征提取器。它在960x544 RGB图像上经过训练,可以检测汽车,行人,交通标志和两个轮车。
访问:
https://ngc.nvidia.com/catalog/models/nvidia:tlt_dashcamnet
VehicleTypeNet
基于ResNet18的分类网络,可以将尺寸为224 x 224的汽车作物分为6类:双门轿跑车,大型车,轿车,SUV,卡车,货车。可以通过DashCamNet或TrafficCamNet进行管道传输,以用于智能城市应用程序。
访问:
https://ngc.nvidia.com/catalog/models/nvidia:tlt_vehicletypenet
FaceDetect-IR
这是一个基于NVIDIA的detectnet_v2架构并以ResNet18作为主干特征提取器的单类面部检测网络。该模型在384x240x3的IR图像上进行了训练,并合成了噪声,并针对人脸靠近相机的使用案例进行了培训,例如视频会议期间的笔记本电脑相机或放在车内观察驾驶员或乘客的相机。当使用红外照明器时,即使可见光条件被认为对于普通彩色相机来说太暗,该模型也可以继续工作。
访问:
https://ngc.nvidia.com/catalog/models/nvidia:tlt_facedetectir
更多信息可以访问:
https://ngc.nvidia.com/catalog/containers/nvidia:tlt-streamanalytics