关注并星标
从此不迷路
计算机视觉研究院
公众号ID|ComputerVisionGzq
学习群|扫码在主页获取加入方式
计算机视觉研究院专栏
作者:Edison_G
秀肌肉还是为了提振股价?
转自《机器之心专栏》
只发布一部手机就能收工的日子一去不复返了,「雷布斯」正在全力加速转型成为「雷斯克」。
去年的这个时候,雷军在 MIX4 发布会的结尾遛了一圈机器狗「铁蛋」,宣布进军仿生四足机器人。
昨晚的雷军年度演讲,小米首款「全尺寸人形仿生机器人」正式登场了。
只见它徐徐上台,手拿一朵小红花:
姓名「CyberOne」,小名「铁大」,高 1.77 米,重 52kg,狮子座,这是它的基本信息。
该说不说,乍一看,「铁大」的运动技能和波士顿动力的 Atlas 相比还有一段距离:
借用一位网友的话,看完最大的感受是:
关于这一点,铁大自己也承认了:「我刚刚学会走路,下盘还不太稳,正在练习扎马步。」
单从它的手部设计来说,目测无法承担太复杂的工作:
不过这只是新项目的一个开始,雷军再次强调了小米在机器人领域的投入和决心:「CyberOne 的 AI 和机械能力都是由小米机器人实验室自主开发的。我们在多个领域投入了大量研发资金,包括软件、硬件和算法创新。」
从零到一的尝试
从目前公开的信息看,「铁大」的驱动方式是电机驱动,最大模组扭矩是 300Nm,峰值扭矩密度是 96Nm。看起来力量要比人类大一些,不过和波士顿动力的液压驱动还比不了。
机器人的全身有 21 个自由度,作为对比,人类的一个手臂有 7 个自由度,一条腿有 6 个。机器人的行走速度为 3.6km/h,相当于人类步行的速度。
在感知能力上,CyberOne 搭载了双麦克风拾音系统和 Mi Sense 空间视觉模组。它的整张脸则是一块 OLED 屏幕。
小米表示,CyberOne 人形机器人有强大的阅读人类情感能力:
人形机器人依靠视觉来处理周围环境。CyberOne 搭载了自主研发的 Mi-Sense 深度视觉模块,结合人工智能交互算法,能够感知 3D 空间,识别个体、手势和表情,不仅能够观察,还能应对复杂环境。为了与现实世界交互,CyberOne 搭载了自主研发的 MiAI 环境语义识别引擎和 MiAI 语音情感识别引擎,能够识别 85 种环境声音和 45 种人类情感。CyberOne 能够识别出人类的快乐,甚至在悲伤时安慰用户。所有这些功能都集成在 CyberOne 的处理单元中, 实时交互信息呈现在曲面 OLED 屏幕上。
为什么科技公司都喜欢造「人」
这几年,很多消费电子品牌都会在发布会上展示了一些机器人产品,包括三星和 LG,所以很难确定小米 CyberOne 要成为严肃产品,还是一种舞台表演形式。
令人欣慰的是,至少它不是特斯拉 AI Day 上那位身着氨纶套装的舞蹈演员:
相对于人工智能的其他应用,完整的机器人产品对于开发者的算法研发、硬件整合能力提出了极高要求。要想让 CyberOne 和雷军完成一次自拍,不知小米在幕后做了多少努力。
从外观来看,我们很难不把 CyberOne 和特斯拉的机器人 Optimus 进行类比。作为一家电动汽车公司,特斯拉早就声明要进军人形机器人领域,马斯克甚至多次表示,擎天柱机器人是特斯拉开发的最重要的产品之一。
在 2021 年第四季度的财报电话会议上,他说:「就产品的优先级而言,我认为今年做的最重要的产品开发实际上是擎天柱人形机器人。随着时间的推移,我认为这有可能比汽车业务更重要。」
去年的特斯拉 AI 日,马斯克已经在 PPT 中勾勒出擎天柱机器人的基本形态:身高约 1.72 米,重约 125 磅(57 公斤),身材匀称,带有一张面部屏幕,能够以约 5 英里 / 小时的速度移动。
今年 6 月 23 日,马斯克在接受彭博社采访时表示,特斯拉人形机器人「擎天柱」的原型将在 9 月底的特斯拉 AI 日活动中登场。
如此看来,小米在抢发时间节点和 CyberOne 设计细节上的对标意味不言而喻。
最后看一下业内反馈。对于昨天的发布,人们褒贬不一,有人认为机器人步履蹒跚,有赶工的嫌疑,或许是上市公司为了拉股价的展示。
也有人认为在人形机器人这个方向上有小米的加入,不论如何对国内技术发展是件好事。
不论如何,CyberOne 已经出来走了两步,未来能做成什么样子,就要看小米的决心了。
等到什么时候,人形机器人可以取代人类的工作呢?
参考内容:
https://www.zhihu.com/question/547996316
© THE END
转载请联系本公众号获得授权
计算机视觉研究院学习群等你加入!
我们开创“计算机视觉协会”知识星球两年有余,也得到很多同学的认可,最近我们又开启了知识星球的运营。我们定时会推送实践型内容与大家分享,在星球里的同学可以随时提问,随时提需求,我们都会及时给予回复及给出对应的答复。
ABOUT
计算机视觉研究院
计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!
VX:2311123606