3D视觉的使命,是重塑制造业的生产、商业模式。
作者 | 秀松
编辑|余快
进入2022年,智能制造成为政府“两会”中的热门词汇。
一方面,国家发改委、工业部、科技部等八部门发布了关于印发《“十四五”智能制造发展规划》的通知,提出国家级的顶层设计;另一方面,各地方政府,如北上广深等一线城市,都已经出台相应政策细则,为推进智能制造提供制度保障。
而在实现智能制造、推动产业升级过程中,机器视觉作为不可或缺的技术,承担起让机械“看得懂、看得细、抓得牢、送得快”的桥梁作用。
换句话说,要让机器代替人力,首先要给机器装上“双眼”,使之能够“看得见”,然后才能像人一样工作,这就是机器视觉。
作为人工智能的一个分支,机器视觉具备人所不能拥有的优势:精度高、可适用于危险工作环境,并且识别效率高,可无间断工作等等。实际上,机器视觉并非新事物,已经被广泛应用在外观检测与识别、货物分拣等工业流程之中。
目前的机器视觉仍以2D为主,即通过摄像头拍到物体平面的照片,然后通过图像分析或比对来识别物体,其局限在于只能观测到物体平面的特征,成像精度容易受照明条件影响,因而适合一些对技术要求不高的中低端制造业。
在一些高端制造领域,例如生物科技、精密半导体等对测量精度要求极高的产业,传统的2D解决方案已经不能满足需求,3D视觉正逐渐崛起,成为市场新宠。
从2D到3D:不止一个维度的区别
3D视觉,即通过3D摄像头采集物体的三维坐标信息,通过算法实现三维立体成像。
与2D视觉系统相比,3D视觉的优势在于,多一维度的信息数据(主要是空间坐标),能满足对体积、形状、距离等信息测量的需要。并且,3D视觉不容易受照明条件的影响,其成像精度远高于2D视觉,同时,其快速处理信息的能力也非2D视觉系统可比。
举个简单的例子:在涉及曲面、有弧度的物体测量时,2D视觉只能拍出平面图,很难反映出物体的真实情况;3D视觉拍出的是立体图,能呈现出物体的曲面、弧度、深度等真实信息,对机器或者人而言更具参考价值。
随着制造业的智能化升级,市场对于3D视觉的需求也在不断提升。根据美国市场研究机构Grand View Research的报告,到2027年,全球3D机器视觉市场规模预计将达到34.6亿美元,预测期内,市场的复合年增长率预计为14.7%,是一个潜在的蓝海市场。
掘金志了解到,当前3D视觉在智能制造中的应用已从单个场景发展到整个生产线的赋能,涉及定位、引导、生产、分拣、装配等多个环节。
以智能手机生产流程为例:在2D视觉时代,应用场景最为广泛的是质检,即尺寸与缺陷检测,涉及主板、零部件及包装三大部分。3D视觉可以直接覆盖这些流程,在检测精度、速率上更胜一筹,并且将应用拓展到上料、生产、检测、封装等场景,实现对原有产线的智能化改造,在上下料、分拣、搬运等环节需根据产品种类的不同实时规划并完成作业任务。
这实际上为厂商的柔性生产提供了便利。在C2M商业模式的带动下,企业需要根据用户实时订单来决定生产规模,以往的机械化生产属于批量生产,柔性很弱,3D视觉提高了工业机器人及自动化设备的智能化水平,使其具备按照实际生产需求来灵活变化生产各种产品。
例如,冬奥期间大火特火的冰墩墩,出现了一“墩”难求的情况。那么厂商需要实时调整生产策略,灵活配置生产原料、生产数量及质检部署,多生产“冰墩墩”,少生产“雪容融”,整个生产环节,都可以利用3D视觉来减少人力成本、提高生产效率。
因此,3D视觉与2D视觉并不简单的是1个维度的信息差异,多一维度信息带来的对生产模式及效率、商业模式的改变,才是其核心要义。
不过,上述例子都是理想状态下的预设。现实情况是,3D视觉虽然具备诸多优势,但要实现广泛应用,还有许多难题要解决。
3D视觉之难:场景、成本
和消费类电子不同,3D视觉在智能制造领域的应用,由于场景碎片化,显得更为复杂。
熵智科技创始人赵青在接受雷峰网采访时曾表示,3D视觉技术的应用落地面临两大难点:
- 3D视觉技术对于应用场景要有强适应能力;
- 3D视觉技术和运动规划技术的衔接。
首先,制造业的生产场景非常复杂,3D视觉在实验室中的效果,可能在实际场景中无法体现,这就要求3D视觉对于应用场景具备强适应能力。例如,在反光、暗黑、覆膜和远距离等条件下是否依然可以准确感知、识别出物体。
其次,3D视觉在感知到物体的三维信息后,需要与运动规划技术进行衔接来完成任务。这又涉及避碰检测、手眼坐标转换、节拍优化和力控等技术。
但机器本身很难像人一样,大脑发出指令就能完成动作;机器需要对输入的信息进行解读,并且将指令传送到各个部分,进而执行命令。其中一个环节出错,就会导致任务失败。
最后,技术本身很难通过标准化来实现对各场景的适配,甚至在同一场景上,对技术的要求都各不相同。比如,在产品的缺陷检测上,厂商的标准是不一样的,对于缺陷的定义也各不相同,很难做一个标准化的缺陷检测工艺。
除了场景化难题之外,3D视觉所依赖的传感器(主要为摄像头)也还无法实现在保证抗环境光干扰能力强、测距精度高、分辨高的同时,降低成本,提高性价比。
因此,目前 3D 视觉的应用主要依据使用场景和预算来选择相机,然后根据相机成像结果来进行定制化的算法开发。这种成本高、周期久的开发模式严重限制了 3D 视觉在实际场景中的应用。
国产3D视觉技术之路:困难重重
根据中国机器视觉产业联盟的统计,国内机器视觉行业以中小企为主,销售额在1亿元以下的企业占据83.5%,而基恩士的销售额早已突破百亿(2020年为321.61亿元),相比较而言,国内过亿营收的企业为奥普特(2020年为6.42亿元,仅为基恩士的2%)。
可以说,在以2D视觉为主的机器视觉领域,全球市场已经形成基恩士和康耐视垄断的局面,而3D视觉技术的出现,被视为改变当前格局的技术推力。
作为新技术,3D视觉所面临的场景化难点,是所有企业都必须解决的问题。目前无论是国外的基恩士、康耐视,还是国内的安防巨头,如海康威视;亦或者诸多AI视觉公司、机器视觉公司,在3D视觉技术领域,都处于同一起跑线上。
不过,相较于国外巨头,国内企业先天性存在三个不足。
- 对场景的理解。
不论是基恩士,还是康耐视,都已经成立数十年,且占据着机器视觉的绝大部分市场;多年的积累使其在探索3D视觉的应用时更具优势,许多场景难点都可以基于以往经验做试探,减少不必要开支。
国内企业成立时间较短,对场景的理解需要一步步探索,甚至多走弯路,为此付出高昂的时间、资金成本。
- 缺乏硬件能力。
机器视觉的主要逻辑是,对收集到的图像信息进行分析处理,智能设备根据处理的信息做出相应判断。这一过程中,镜片以及镜头的质量对获取图像信息的准确性起到非常关键的作用。
国内多数公司以软件算法切入,集中在应用层,缺少相应的硬件能力。国内3D视觉的核心相机大部分为外购,包括IDS、康耐视、基恩士、佳能等,而在镜头方面,高端市场仍为徕卡、施耐德、尼康、富士等国外品牌所垄断。
- 稳定的客户群体。
对于客户而言,随意更换合作伙伴,很容易增加试错成本。即便是新技术,客户也往往愿意选择已经有过合作的技术供应商。显然,国外巨头具备绝对优势,而国内企业要发展,只能一步一步“升级打怪”,以技术和产品获取用户信任,逐渐建立起属于自己的客户群。
这反映出一个深刻的现实:在新技术面前,企业都是平等的,但老牌企业仍然可以依据自身的业务生态,对新(小)企业实施降维打击。
因此,国内企业要追赶国外巨头,除了技术突破以外,还需要建立起稳定的生态圈,这是一个漫长而艰难的过程。
结语
当前,3D视觉在消费电子上的广泛应用,对机器视觉公司产生了极强的刺激效应。智能制造作为下一个蓝海市场,越来越多的企业开始探索以3D视觉来赋能企业生产的路径。
但与消费电子不同,智能制造很难出现现象级应用,整个市场需求都是碎片化的,因而不可能复制前者的发展模式,企业必须在实际场景中去寻找最佳落地解决方案。
对于国内企业而言,先天性的不足并非不可逾越的障碍,需要付出比国外巨头更多的时间和精力,去理解场景、钻研技术,一步一个脚印夯实基础,然后追赶。这不仅需要视觉公司的努力,也需要光学、制造业等多个产业的共同进步。
参考资料:
- https://blog.csdn.net/kangjielearning/article/details/109249539
- https://m.thepaper.cn/baijiahao_15594039
- https://en.wikipedia.org/wiki/Machine_vision
- https://36kr.com/p/773813443523845
- https://www.leiphone.com/category/robot/2kHE427wIXhOtN1n.html
- https://baijiahao.baidu.com/s?id=1715395976735890506&wfr=spider&for=pc
- https://www.leiphone.com/category/aijuejinzhi/SwQdNwJfSL8wLISo.html