鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI
国内首个手机AR实景行车驾驶导航上线了。
能贴合道路给出路径指引,转弯处还有立体箭头引导:
能够识别车辆、行人,及时给出碰撞预警:
夜间识别,也不在话下:
带来如此新鲜体验的,是搜狗地图。
无需额外购买昂贵的设备,只需一台手机,一个App,即可体验。
视觉感知技术 导航
传统导航定位,是以GPS为主,并使用陀螺仪、加速度计等传感器来提升精度。但在这种精度下,车道级定位目前在技术上是比较难以实现的。这也就是实际使用地图软件导航过程中,常常遇见的主辅路不分、转弯路口指示不清晰等问题出现的原因。
不过,其实还有一种非常常见的传感器尚未得到充分利用,那就是摄像头。
AR导航,实际上就是把视觉感知技术引入到地图导航之中。
有了视觉这一重感知,所见即所在成为可能,结合GPS导航,整个系统横向和纵向的定位能力都会得到提升,实现车道级识别。
视觉感知技术
此前,搜狗在AI语音技术方面已经有了相当深厚的积累,但视觉感知技术相对而言并非研发重点。
为了让产品能够快速落地,搜狗地图选择了两条腿走路:一方面,投入力量自研计算机视觉技术;另一方面,跟mapbox这样的地图供应商进行合作开发。
目前,在算法性能方面,搜狗地图总经理孔祥来表示,召回率超过90%,准确率接近90%。
在2019年12月27日全网发布的搜狗地图App 10.6版本中,通过引入车道线识别、物体识别、语义分割、AR叠加等技术,搜狗地图AR导航已经实现了转折指引、碰撞预警等功能,并且日间、夜间均能够清晰识别道路,呈现效果。
下一步,还将进一步推进到车道级并线引导、主辅路切换识别这样的车道级定位,以及地标、路牌、场景识别等等。
搜狗地图AR导航的另一个特点是,计算完全在本地进行,无需消耗额外的流量。
孔祥来指出,本地计算是他们一开始就设定的目标,因为以现阶段的技术,要把视频流传回云端计算,模型解码之后再把结果传回前端,这个过程中的延迟、对网络的要求,对于应用而言是不可行的。
而本地计算对硬件的要求也并不算高,在搜狗的测试中,iPhone 6s以上机型均可流畅运行AR导航功能。即苹果A9、骁龙650及以上芯片就能够负载本地计算。
安全
完全本地计算的另一个考量,是安全问题。
将用户数据保存在本地,能最大程度地保护用户隐私。
此外,由于现阶段的AR导航是在手机端实现的,什么样的交互才能避免分散用户注意力、提升安全等级,也是搜狗地图在产品上线过程中一直思考的问题。
孔祥来表示,虽然AR版本已经发布,但远不是“最终形态”,搜狗地图仍将不断考虑交互设计的合理度。
比如跟汽车厂商合作,使用车载摄像头或行车记录仪来完成采集,并采用主副屏、超宽屏的显示方式。
这样的解决方案会在今年的Q1或Q2推向用户。
为何要做AR实景导航
近年来,AR导航俨然成为一个热点,谷歌、百度、高德、四维图新等传统地图商纷纷入局。但孔祥来说,搜狗地图做AR导航,并不是为了赶时髦。
而是因为在用户体验层面,AR导航将是导航领域一个非常重要的技术方向。
第一,AR导航为地图厂商们构建高精度地图提供一个新的思路。
传统的地图测绘方式,是地图厂商的专业队伍,按照一定的作业规程定期扫街、带回数据。
这样的更新速度,如今显然满足不了互联网用户的需求。
利用AR技术,把用户在使用地图导航过程中,摄像头记录的实景作为一种新的数据加入,实际上是打通了用户参与高精地图共建的路径,将能够极大改善传统方式效率低、成本高的局面。
当然,搜狗地图也强调,不会在用户不知情的情况下将数据回传云端。将来打通这一功能时,会告知用户并在用户自愿的原则上,让他们参与到高精地图的数据采集任务中。
如此,在未来的地图生态中,图商能够得到质量非常高的实时数据,更新数据的成本会大大降低。而用户作为数据提供方,也能获得实际的收益。
第二,是激活后装市场,促进汽车硬件厂商的产品线和产品附加价值增长。
目前许多车主都在自己的车上装了行车记录仪。但很多人想到要用记录仪的时候,往往是因为遇到了事故或纠纷,在平常,行车记录仪实际上是一个“沉默设备”。
把AR技术引入导航,行车记录仪就可以成为导航的“眼睛”,这种市场占有率高,但活跃度却并不高的设备就能被激活起来。
也就是说,AR导航将给后装市场带来一种全新的模式和增长。
第三,对主机厂商而言,其实是迫切需要AR导航这样的新导航技术的引入的。
因为过去几年,车厂的原装软件一直备受吐槽。车上的硬件虽好,软件却跟不上。
搜狗跟汽车厂商合作,通过车载屏幕为用户提供高沉浸、高精准和高安全性导航功能,一方面是提升了用户体验,另一方面也能使车载硬件的能力得到充分发挥。有利于车厂提升汽车销量,提升品牌调性。
而更重要的,还是AR导航能够针对用户痛点,解决最实际的问题。
孔祥来表示:
我们坚持认为,应该把工具做得更纯粹,地图应该回归其本质。
一直以来,用户对于地图导航软件最大的诟病一直都是数据更新慢、导航精度不够高。而搜狗地图想要从应用层面上解决这个问题,最重要的就是要给导航引入新的感知能力——视觉。
为什么是搜狗?
毫无疑问,AI正在席卷一切、变革一切。
而搜狗,也是国内AI发展最快的公司,特别在语言语义领域,更是频频在全球竞技中证明了实力。
见惯了语音输入转写、机器翻译、合成主播之后,其实AR导航背后,也是搜狗AI引擎驱动和作用的结果。
因为AR导航,背后也需要对语音、语义的超强理解,而车场景更是垂直落地的最佳领域之一。
早在AR导航之前,搜狗就推出过智能语音副驾产品。
现在则进一步借助视觉 导航,让AR实景驾驶导航成为现实。
并且不借助任何第三方设备,无需额外付出成本,让用户能最快上手,体验新技术带来的新体验。
那么AR技术的引入,会给整个地图行业带来怎样的改变?
孔祥来坦承,在现阶段,AR导航还是摸着石头过河,没有哪家AR导航是“终极形态”。
就像社交软件刚推出来的时候,大家都不知道社交软件应该是什么样。但随着Facebook、微信这样的产品成为事实标准,形态也就清晰了。 AR到底会做成什么样,会有很多不同的理解。但我认为,它会使未来的行业产生巨大的改变。因为各方面条件已经具备了。
而手机AR实景导航的上线,还只是搜狗地图探索的第一步。
AR AI,大势所趋
当然,这一步,也不止搜狗一家在迈。
作为最被看好的新技术方向之一,AR承载的是下一代交互的使命和希望。
外有苹果、谷歌,微软,内有BAT搜狗,无一不在抢滩AR研发和落地应用。
而且AI技术加持,进一步带来图像视觉和语义理解方面的突破,AR AI,似乎只剩下一个杀手级产品、应用便能打开局面狂飙突进。
然而声势汹涌之下,目前我们现实生活中依然还没有大规模应用的AR案例,AR想要连接的两个世界——线上虚拟和线下物理,依然缺乏最重要的载体介质。
于是探索方案层出不穷,软硬件载体一个接一个,之前有AR眼镜,但实际应用场景依然待考。
如今搜狗试水“车载”场景,看起来是可以带来大规模商用可行性,毕竟痛点和刚需明显,而垂直场景对技术长尾挑战相对小一些。
虽然能否真正引爆用户、变革行业,或许还要进一步经受时间检验。
但毫无疑问,搜狗今日迈出的车载场景一小步,未来也可能成为AR智能产品规模化商用的第一步。
给点时间,保持期待,未来或许来得比想象更快~
你说呢?
— 完 —