在不确定中抓住确定性,君正T41推动专业AI普惠化。
作者 | 李溪
编辑 | 余快
泛视觉行业正经历冰与火的双重夹击。
国内外形势风云变幻,资本持续观望,新兴创业企业脚步趋缓,经济下行如寒霜在夜里蔓延,传导至整个产业链。
但广袤的土地之下,无数场景需求如新芽探出头,迸发出碎片但不可阻挡的活力,这是技术、市场行至今日自发的驱动力。
是的,泛视觉领域的车轮没有也不会停止,专业AI普惠化,正成为泛视觉行业未来最大的确定性。
视觉AI普惠趋势下,海量碎片化市场如雨后春笋,产品需要新的功能,品牌需要新的品类,行业需要更丰富的AI算力,更低的功耗,更低的整体成本,长期更好的品质和有效的功能创新。
在这种背景下,北京君正正式推出全新一代12nm工艺AIPC芯片T41,以泛视觉行业专业AI普惠化为目标,力图为行业注入确定性。
T41系列芯片,可应用于专业安防,智慧家庭,机器视觉,算法识别,低功耗视频,会议视频,车载影像等广泛领域。
一款好芯片背后的「自我修养」
海思之后,发力进攻高端芯片的企业比比皆是,但并非都具备中高端芯片的能力,目前大部分厂商存在一个或多个短板。核心技术要有充分的积累,而这并非一朝一夕就能达到。
中高端芯片壁垒大致在以下几个方面:
算力 4K成像和编码能力 低功耗 开发工具成熟度与易用性
在更广阔的视觉领域,视频物联芯片考察本身竞争力、集成方式、开发工具成熟度与易用性、功耗与价格等。
这对芯片厂商提出的综合要求明显提高,需要具备完整能力的芯片。
一款好的芯片,一定需在实际场景中打磨迭代而出,缺乏经年累月的正向打磨,很难沉淀AI工程化交付能力。
君正多年来一直在强化自身优势基础上,在以上几个方面扩展和突破。
衡量一款芯片是否达到AI工程化交付能力,算力实为衡量AI芯片指标的重要因素之一。
- 12nm工艺,1.2T@int8真实算力
T41采用当前行业最先进的12nm工艺,有效解决了算力密度和功耗发热的问题,从本质上提升了芯片的性价比。先进工艺可以带来物理上实实在在的优势,这是摩尔定律问世以来半导体行业的基本规律。君正上一代主力芯片T31第一个进入22nm节点,并以此取得突出成绩,足以充分说明问题。
在泛视觉行业中,算力诉求和成本/功耗之间的矛盾在22/28nm工艺上难以化解,随着行业内卷加剧,出现了算力虚标风气。T41以12nm先进工艺的方法,从物理上实现矛盾突破。
T41内置君正最新的神经网络加速引擎,支持1.2T@int8/4.8@int4真实算力,支持int16/int8/int4/int2混合量化,可以有效节省算法推理的内存占用,降低功耗。
- Magik 2.0开发平台
芯片的平台软件开发工具非常重要,相关工具是不是易用、稳定,对于AI应用开发者来说都非常重要。如果开发工具不成熟或不易用,很容易就会被开发者和市场抛弃。
经历了Magik1.0时代的各种磨砺和考验,Magik2.0算法开发平台更加成熟,完善,开放。
Magik2.0全面升级了后量化工具链。Model-Zoo更加丰富,算子更加丰富,工具链更加简便,支持仿真推理/精度分析/调优/图融合,支持第三方量化参数导入。
在训练感知量化方面,Magik2.0推出了全新的快速量化方法(FQAT)。使用FQAT,可以大幅缩短训练量化过程,开发者无需修改代码,直接上手,训练量化时间缩短一半。利用FQAT,可以进一步降低混合量化门槛,充分发挥T41芯片的越级算力。
另外,在优化整体成本方面,Magik2.0通过支持按需提取算子和底层库,支持混合量化等方法,实现减少内存占用,减少模型存储占用,让普惠AI更进一步。
- 4K成像和编码
对清晰度的追求是永恒话题。随着泛视觉的发展,4K甚至8K成像逐渐成为标配。
而更高的成像则需要更高性能的编码芯片。
T41支持3840*2160画幅的成像与编码,最大性能可达2160P@30fps。不同型号之间实现pin2pin兼容,可以一套硬件设计,覆盖2MP~8MP分辨率的各种应用。
在四/五百万分辨率成熟普及之后,T41还可以支持即将兴起的六百万分辨率。结合AI赋能,600W AI有望成为智能安防行业不久后新的重要卖点。
T41内置最新升级版Tiziano ISP,具有出色的图像处理能力。新增了TMO/SAO/CSCRC等模块,能够提升动态范围和视频饱和度、亮度。优化了DMSC/YSP/LSC/WDR/MSCA等模块,继续提升解析力,提升低照度效果,在细节处更加自然流畅。
- 低功耗视频
功耗,也是AI芯片领域永恒不变的话题。
低功耗,是君正长期内在的技术基因之一。从早年的教育电子/PMP,到之前的可穿戴腕表,再到当前的泛视觉领域,君正芯片历来是功耗的佼佼者。
得益于T31/T40持续在低功耗视频市场的深入,T41从三个方面巩固和扩大君正视频在该市场的技术优势:持续提升基础特性,带来若干创新功能和更低的功耗。
在新版RISC-V,双flash,双通道LZMA等众多物理技术加成下,T41支持在标准的Linux OS情况下,150ms级别的快速启动时间。基于T41打造电池门铃,摄像机等产品可以完全复用之前T31成熟的外设环境,复用之前的软件方案,只需要升级Magik2.0就可以享用新版算力和算法。
T41创新性设计了Zboost技术,基于此技术,可以实现<100ms的快速启动时间,实现AI模型零延迟加载。配合恰当的CIS和MCU,可以落地若干创新性新功能。
在12nm工艺加持下,T41的整体运行功耗低出新的记录,以更高的性能,在可比条件下,成为目前君正T系列家族中功耗最低的产品。
落地的竞争力从何而来?
根据Gartner发布的2020人工智能技术成熟度曲线,计算机视觉技术已趋于成熟,相关产业正在经历洗牌。
人工智能视觉领域已经由技术萌芽阶段、头部场景落地阶段,发展到大规模工程化应用阶段。在这一阶段,市场对于人工智能技术落地提出了两大核心诉求。
产品品类的丰富与解决方案的协同。
IPC芯片、AI算法、NVR以及低功耗摄像机之间,将形成整体串联的方案。
这个变化,意味着芯片企业不单要考虑产品线,还要加大对AI的投入,以市场需求为导向,提供涵盖各品类、低中高端的产品。
AI视觉芯片企业要建立壁垒,除了有灵敏的市场嗅觉与战略部署之外,芯片本身属于技术 资金密集型产业,不存在投机情况,企业要有长期持续投入人才和资金的定力。
北京君正在视觉领域摸爬滚打十几年,在智能安防市场也投入多年,2016-2021年安防SoC领域营收不断增加。
自北京君进攻安防后端芯片,推出NVR芯片以来,一直在完善智能安防前后端产品。
同时利用Magik2.0平台的平滑性,可以轻松地分别把算法功能部署到前端摄像机或者后端NVR上。
以一个“16 1”的套装组合为例,16台T41智能摄像机配合一台A1 NVR,可以形成合计高达20T@int8/80T@int4的分布式算力。通过软件方案将AI功能分布于该系统之内,就可以实现算力强大,成本可控,灵活调度的AI系统。
目前基于A1的智能NVR产品正在陆续量产,T41也在陆续研发中,很快就可以在市场上看到基于君正AI的完整前后端产品套装。
T41搭配智能NVR芯片A1,可以组成完整的AI前后端产品闭环。
而在解决方案上,除了内置ePHY、RTC、Audio高集成度以外,T41系列还提供多种pin2pin的型号,内置不同容量的DDR,以方便一套设计覆盖全系应用。
针对AI集成之后带来的内存增加flash增加的问题,T41内部进行了深度数据流优化,可以更节省内存,带宽和存储空间,让512Mb 16MB的产品也可以落地高精度的AI算法。
基于以上的技术优势,T41系列推荐几种典型方案,极具竞争力:
512Mb DDR 16MB Flash,落地5MP@30fps D1@30fps 精准人车检测算法 1Gb DDR,落地8MP@25fps D1@25fps 精准人车楼宠算法 1Gb LPDDR3,落地下一代创新性低功耗摄像机 精准人车楼宠算法
眼下君正视觉产品和解决方案落地领域涵盖专业监控、消费类视频、电池门铃、视频门锁、运营商、视频会议、机器视觉、车载监控、工业和医疗等众多领域。精于安防,又超越安防,君正技术和产品的多样性特点正好契合了视觉物联网的发展要求。
海思之后,市场并未沉寂,而是愈发活跃:国内主流安防芯片企业、AI芯片企业都在加大研发投入,志在成为行业TOP3。
这场拉力赛,必将在AI安防行业留下浓墨重彩的一笔。