MIT「迷你猎豹」秒速3.9米刷新四足机器人世界记录,但还是跑不过苏炳添

2022-03-21 10:41:07 浏览数 (1)


新智元报道  

编辑:袁榭 时光

【新智元导读】步态欠潇洒不要紧,只要速度足够快!MIT四足机器人刷新世界记录,靠的是合成数据训练机器!

自2014年立项以来,MIT的机器猎豹项目在四足机器人界屡有突破和贡献。

刚刚,迷你猎豹(Mini Cheetah)又晒出了新成绩:创下了秒速3.9米的四足机器人行进速度世界记录。

MIT机器猎豹,四足机器人里跑得最快

当下,各种机器人公司和项目,为了刷存在感,同时也给投资人信心,最时兴让机器人玩杂耍。

比如,2019年中,既有波士顿动力的两足机器人耍后空翻,也有MIT的四足机器猎豹耍后空翻,堪称业界热点、一时瑜亮。

当然,后空翻的意义不止于好看,还在于展示控制系统与行进机制的稳健性,以及体现处理输入数据的速度。

然而,机器人项目绕不过的难题是——它除了「稳」,还要「快」!

现在,市面上的各路机器狗产品价格堪比上档次的汽车,速度却远远跟不上。

当下机器狗的老头慢遛速度,让各种搞钱广告的杂技展示都减色不少。比如以下这种足球运动,有哪种真实动物会慢成这样呢……

不过2022年3月份,MIT的四足机器猎豹,终于比不管是东方还是西方的竞品都跑得还快了。

按照研究团队的数据,现在MIT的四足机器猎豹室内运动速度上限是秒速3.9米。

室外运动上限是秒速3.4米。

室内原地旋转的角速度是每秒5.7弧度。

考虑到没练过的普通人类整体旋转的角速度也就是每秒6-9弧度(花样滑冰运动员能转出每秒40弧度以上),机器猎豹打转的敏捷度已经很值得称道了。

换算一下,MIT的机器猎豹现在室内速度接近9迈,室外速度接近8迈。

直观地说,虽然与汽车相比,这速度还不算挂一档。但如果这数字调在跑步机上的话,即使健身狂魔们也得出汗费力才能跟上了。

此前的MIT机器猎豹,只算得上是四脚爬爬,现在才能真算上「跑步前进」了。尽管比不得活猎豹,但「迷你猎豹」(Mini Cheetah)跑赢真人肥宅似乎不算难事。

而且考虑到机器猎豹在冰上能维持同等运动速度与灵活度,真人恐怕还做不到咧。

步态不潇洒?

如图所示,迷你猎豹的步态还有点笨拙,没有猎豹的矫健身姿,看起来倒像一只小狗在地板上抓来抓去。

这是因为,AI除了加速之外没有优化任何东西。

「强化学习能找到跑得快的解决方案,但由于其奖励功能不明确,它没有理由选择一种「看起来更自然」或「人类更喜欢的」步态。」研究者称。

当高速移动时,它可能不是最优雅的姿态。

诚如研究者所言,「这个模型当然可以被指导开发一种更流畅的运动形式,但此次大家努力的重点只是优化速度」。

业界趋势:合成数据训练机器狗

教四足机器人运动,此前无外乎是两种途径:

摄像头等传感器搜集现实数据,然后码农手动编程处理数据;

或码农将传感器搜集的现实数据作为数据训练集,训练AI控制四足机器人动作。

「投多少人工出多少智能」,这两种办法其实都是耗时费力。

码农手动编程的时间成本与资源耗费不消说,环境出个变化就得手工改程序。

拿现实世界数据使劲训练AI,现在也遇到瓶颈了。

现实世界的数据变量实在太丰富,各种雄心勃勃要搞全无人L4自动驾驶的大车厂们就因此在训练AI上吃了大瘪:

砾石地、沙地、雪地的路况不同,不同风速、湿度、颗粒物状态的空气能见度不同,路上各种从活人到井盖的物体运动状况不同。越要训练出能因应万象的AI司机,现实数据的搜集和处理成本就越大。

当然如果和马斯克一样跳脱,在车上装超级电脑来走数据跑AI。理论上也不是不可以,只是现实中人会说这种解决方案是神经病。

穷则思变,如果现实数据搞起来太累太麻烦,那么换合成数据,不是就跑通了么?

现在业界巨擘们纷纷搞模拟环境/合成数据。谷歌拿NeRF为Waymo的无人车训练渲染了个模拟旧金山出来。英伟达在猛砸资源做Omniverse Replicator。

斩牛刀可以用来杀鸡,合成数据连参数和变量大到吓人的无人车AI都可以用,两足/四足机器人要面临的环境变量少得多,自然也可以用。

2021年起,加州大学伯克利分校的研究团队就在用模拟环境训练两足机器人Cassie。据称Meta的AI团队也在用模拟环境训练四足机器人。

MIT团队训练机器猎豹:3小时合成逾百日数据量

四足机器人界的泰山北斗之一、MIT的机器猎豹项目,自不甘人后。

研究团队完全不用摄像头等传感器输入真实外界数据,完全在模拟环境中训练控制机器猎豹的AI。

不得不说,效果满好。

由MIT研究团队释出的实景对比图像可以看出:

人工预编程的控制软件,让机器猎豹的步态更好看,但砾石地上的复杂路况大大限制了行动速度与敏捷度。

而在模拟环境中、通过奖惩机制训练的强化学习AI模型,控制下的机器猎豹酷似野狗乱爬,但速度和敏捷度提升了不止一个档次。

MIT研究小组表示,他们的环境模拟器在3小时内生成了相当于过百天的各种地形、天气等环境变化数据,以此为训练集来用强化学习方法训练机器猎豹的控制AI。

如此训练出的步态控制模型,的确很可能无法判别机器猎豹足下的是冰地还是砾石地。但AI判断出形态不稳、步态受干扰、要倒的结果速度可是大大提升了。

因此机器猎豹步态与形体的因应方案虽然难看,但既能高速前冲、又不会同时仆街,这个成就在四足机器人界可是前所未有。

如下图所示,用合成数据训练的强化学习AI,让机器猎豹成功过坎,避免了此前的仆街状况。

落地前景

MIT计算机科学和人工智能实验室(CSAIL)的研究人员相信,他们的技术可以用于提高其它机器人系统能力,尤其适用工厂发货前的组装系统。

全球疫情加速了机器人在工业中的应用,根据《自动化世界》(Automation World)的一项调查,在组装和制造工厂中,已经有44.9%工厂将机器人视为不可或缺的一部分。

现在,MIT开发设计的「迷你猎豹」系统,可以通过模拟环境进行强化学习,加快了运行时间。这种管线操作模式能用来训练机器猎豹,就能用来训练流水线机器人。

而且合成数据 强化学习这种模式还有个好处,就是摆脱了传感器的关注局限、让AI更加高效流畅地得出结果。

机器猎豹在快跑冲刺时,所有机件都出于满负荷运载状态,这时AI不会管是因为地面太滑要倒、还是螺丝松了要倒,给出的姿态解决方案只要达到“不会倒”的结果就好。

同样的模式应用在流水线机器人上,那可真是为生产效率提了个大台阶。

参考资料:

https://venturebeat.com/2022/03/17/mit-researchers-use-simulation-to-train-a-robot-to-run-at-high-speeds/

https://www.theverge.com/2022/3/17/22982620/robot-run-speed-mit-mini-cheetah-ai-reinforcement-learning

https://gizmodo.com/mits-robotic-cheetah-taught-itself-how-to-run-sets-new-1848656968

https://futurism.com/the-byte/mits-robot-cheetah-run

https://sites.google.com/view/model-free-speed/

0 人点赞