最关键、最难啃的技术,被这群小米工程师搞定了

2020-11-13 11:53:08 浏览数 (1)

机器之心原创

作者:李泽南

在小米,一群可爱的工程师正在埋头打造硬核技术。

人才是我们的创新之源。小米今年新招聘入职的数量已超过 2250 人,研发团队规模达到了一万人。2021 年我们还将扩招 5000 名工程师,进一步扩充研发团队,并增加研发投入。」在第四届小米开发者大会 MIDC 上,小米创始人雷军说道。

11 月 5 日,北京小米科技园内,小米发布和开源了一系列最新技术,也为明年的人才争夺战放出了自己的计划。

5000 人这个数量相当于把今天的小米再扩大超过 20%。具体而言,技术团队扩张的方向则会覆盖包括 5G、6G 通讯标准技术的十大重要领域:

雷军发布了小米 2021 年招新的主要方向。

在小米,未来技术发展方向是由技术委员会来负责制定的。这十个重点领域的选择,出自小米集团副总裁、集团技术委员会主席崔宝秋之手。在开发者大会上,崔宝秋为自己主要介绍技术积累的演讲中临时加入了有关人才的内容,提及小米自然语言首席科学家王斌,以及 Daniel Povey 博士。

「我们一直在思考小米要在哪些领域重点投入、布下重兵。这里有几大原则,其中一个就是要围绕核心业务,打造小米的核心技术。小米的核心业务是手机乘 AIoT。」崔宝秋说道。

小米集团副总裁、集团技术委员会主席崔宝秋博士。

人工智能等新技术的发展需要资金的投入,人才是重中之重。但人才又是难得的:近年来我们看到了很多科技公司的 AI 大牛跳槽、创业或回归学界,在 AI Lab 中做研究应该偏向应用还是偏向理论,一直是研究人员们绕不开的话题。

小米却在近期吸引了 Daniel Povey 这样的语音技术顶尖学者,并组织起团队,推动了语音识别开源工具 Kaldi 的发展。在崔宝秋等人看来,成功的原因在于打造「近乎完美」的环境

真正属于研究者的环境

「这样的完美不意味着最高的薪酬、豪华的办公条件、自由的工作时间或者很低的 KPI。对于这样的人才来说,他们是无需太多管理的,但又有不同的需求,」崔宝秋表示。「Daniel 当时希望 Kaldi 能够继续保持百分百的开源,这与小米的理念不谋而合。同时由于他来自大学,不希望被业务需求拖累,这也是我们所能够理解的。一个需要预研的技术,其团队需要被保护起来,技术研发要和产品做解耦。」

来到小米也意味着 Daniel Povey 可以为构建自己的语音技术团队找到合适的人。这一年以来,崔宝秋问 Daniel 最多的问题就是:你需要招人吗?从内部转岗到外部招聘,Kaldi 团队一直在不断壮大。

至于新技术落地的事,小米也并没有担心很多。Daniel Povey 上线的代码,当天就能被小爱同学开发团队用上,让产品从计划中瞬间提升到可以用的水平。

随着技术的进步和设备的普及,小爱同学如今已经成为非常活跃的 AI 语音交互平台。

大牛被小米的氛围吸引加入,随后又吸引了更多人才慕名而来,小米也在做硬核技术的道路上不断加快脚步。2020 年,小米启动了创业以来规模最大的校园招聘,截至 11 月共有 2252 名新人入职,其中研究生以上学历的达 1470 人。

在最近一段时间,国内大厂都开启了抢人计划。雷军所说的 5000 人工程师团队扩招的方向,代表了现阶段小米发展的需求,我们可以从中看出小米未来很长一段时间的发展图景。

崔宝秋一直强调技术预研的重要性——今天我们看到的新技术,背后可能需要多年时间的积累。今天小米在不少方面实现的领先,源于长时间的投入。但小米的新突破,很长一段时间里都不那么引人注目。

「这主要是因为小米在早几年业务发展太快。员工们首先想的是把产品落地,所以很少会去参加比赛、写文章,进行技术交流导致的,」崔宝秋说道。「第二个原因在于,小米很多工程师都太务实了,喜欢埋头干,不愿意出去讲。就像 Daniel Povey 一样,宁愿写写代码也不愿意改 PPT。我觉得他们不是故意低调,而是没想过这些东西。在我看来,有时候他们是非常可爱的。」

崔宝秋也在一直在推动小米工程师们参与各种形式的交流。小米成立至今刚过十年,开发者大会就办了四届,今年这家公司在研发上的投入已超过 100 亿元,不断加码的技术投入在最近有了回报。

让人工智能更贴心,技术更开放

在 MIDC 上,小爱同学获得了大幅度更新。

现在的小爱同学,拥有更强大的全场景服务能力,能够聪明地感知、理解和预测用户的控制指令和需求,并会适时主动地进行提醒,甚至带来「关怀」。

按照小米的说法,它已经从语音助手,升级成为智能生活助手,冷酷的智能变成了有温度的智能:小爱同学可以对儿童进行贴心的提醒和简单的教导,如果快递员打来电话,AI 可以自动帮你和他们进行交流。科幻电影中的便利,现在每个人都可以享受到了。

不仅是更加聪明,还有更加贴心,小米着重展示了小爱同学的主动提醒能力:AI 可以主动向人提供建议,包括早睡、异常天气、运动健康、课程提醒等等。如果你最近正在减肥,小爱同学会告诉你要少吃高热量的食物。

智能电视上的小爱同学,还可以通过声纹识别每个人,为用户提供智能化的追剧、继续播放的体验。

不同的智能设备上,有同一个小爱同学。

除了应用还有工具,小米发布了 MiNLP 3.0 版,全新的四大功能模块包括技术算法、语义理解,以及新增的内容理解和舆情分析部分。通过预训练模型、知识图谱等技术,小米的 NLP 工具有了更加强大的语义解析能力。在多模态领域,小米手机和各种设备已经可以利用文本、语音、图像和视频等内容进行综合理解。

说到小米的语音技术,就不得不提 Daniel Povey,这位语音领域大牛第一次在小米亮相正好是在上一届 MIDC 大会上。来到小米之后一年时间里,他的工作进展或许「算不上顺利」——因为他在开发 Kaldi 的过程中,经历了一段时间的探索与思考,决定从头开始重新设计 Kaldi 2 代语音框架的架构。

「Daniel 的风格是追求完美,希望能够一步到位。现在我们看到的 Kaldi 2.0 版,与当初用 Pybind11 封装部分代码,并在 PyTorch 中调用的计划完全不同。不过看来在他的计划中,Kaldi 的大致框架已经完成,未来整个项目将会快速发展。」崔宝秋说道。

凡事要有「Plan B」:Daniel Povey 正在介绍下一代 Kaldi。

下一代的 Kaldi 将分为三部分:训练数据准备部分 LHOTSE、核心算法部分 K2 和示例脚本集合部分 ICEFALL,新一代 Kaldi 将同时支持 PyTorch 和 TensorFlow 两种深度学习框架,同时继续支持 GPU 训练。即将在本周开源的 K2 相较于其他一些语音识别库具有更快的速度,同时也可以用来建模多种语音识别算法。

2020 年初的疫情期间,Daniel Povey 并没有离开中国。对于小米员工来说,他给人印象最深的是脚上的凉鞋,还有在咖啡馆里写代码的背影。

在 MIDC 上,Povey 表示想要完成预定的目标,自己的团队还需要更多人才。来小米共同构建下一代 Kaldi,你准备好了吗?

加入小米 Kaldi 团队,Daniel Povey 会送你「联名款」凉鞋。

在 MIDC 上,小米正式开源了移动端 AI 框架 MACE 1.0 版,其中新加入的微控制器 AI 框架 MACE Micro 以极小尺寸和功耗为 IoT 产品带来了更多可能性。此外,小米还提出了基于 NuttX 打造的物联网软件平台 Xiaomi Vela,其具有高性价比、可剪裁、代码易复用、完整度高等优势。Vela 会在小米 IoT 模组上落地,很快对智能家居的大部分品类提供支持。

小米手机:满是黑科技

AIoT 的核心是手机,在今年 8 月发布的小米 10 至尊纪念版上,我们可以看到这家公司实力的一面:从 23 分钟就能从零到满的 120W 有线快充,到双 8K 视频拍摄加 120 倍变焦,登顶 DXOMark 排行榜的摄像头模组,再到 120Hz 刷新率的「专业级」屏幕。拿起这款手机,我们不仅可以获得更好的体验,自智能手机时代以来的生活习惯也会得到改变。更不用说这款手机有一些版本是由小米自家的智能工厂打造的。

小米的第一代智能工厂 2020 年初投产,已经交付使用了半年,这座黑灯工厂只需要 100 多名工程师值班,每年可生产一百万台高端智能手机,已经成为目前手机行业中最先进的自动化生产线。

「这座工厂最让我骄傲的是:除了贴片机以外,几乎所有的设备都是由小米自研和小米投资的工厂提供的,」雷军说道。「智能工厂第一期实现了除上下料,其他工作全部自动化。我们正在规划的第二期规模比它要大十倍。我们未来努力的方向是整个工厂一个人都没有。」

小米 10 至尊纪念版的 DXOMark 拍照基准分数今年在排行榜第一的位置占据了长达四个月的时间,它背后正有一段小米死磕硬核技术的故事。早在 2016 年 4 月,小米在手机业务部门成立了核心器件部,下设相机组。随着技术的不断发展,在 2018 年 5 月,小米相机部成为了单独的一级部门。

迄今为止,小米的拍摄技术团队已有已经形成了一个 826 人规模的相机团队,以及一个超过 350 人的 AI 影像技术团队。这个部门在北京、巴黎、东京、圣地亚哥等全球九个城市设有研发中心。

在 MIDC 上,小米将手机相机的一些硬件和软件能力开放给了所有开发者。「小米手机的影像处理能力,也会对各类 IoT 设备开放。相比大多数智能家居设备,手机的算力和内存更大,产生影像数据的设备现在可以充分利用手机的算力和算法来处理影像了。」崔宝秋介绍道。

在小米的手机部门,还有很多即将出炉的黑科技,如「一指连」UWB 技术:让手机指向空调就会自动出现空调遥控面板,指向音箱就可以直接操控音箱,这种大幅度减少操作的设计提升了用户的体验。小米表示,手机现在可以做到正负三度的精准度,以及厘米级的定位,未来还希望能够做到更精确,让口袋中的手机自动开门锁。

「一指连」

强大的影像技术之外,小米在手机屏幕和无线充电等方向上也都有自己的技术储备。下一代的旗舰机,现在有望能用上 80 瓦的无线充电。

5G 通信网络大规模铺设,疫情以及国际环境的变化让最近的全球手机市场出现了新形势:Canalys、IDC 等机构发布的最新报告均显示,小米手机的销量已重返全球智能手机出货量的前三。

我们 2014 年第三季度是世界前三,现在再次回到了世界前三的位置,这背后的秘密是技术为本。在过去一段时间里,小米进行了大规模的『补课』,每年的研发经费都有高额增加,」雷军说道。「在工程师们的努力下,我们能够看到小米的技术实力越来越强,市场份额越来越高。」

但对于早已进入存量时代的市场来说,未来竞争只会更加激烈,小米要做的唯有不断创新。明年初,小米的新一代旗舰机型即将出炉,让我们一起期待小米的最新科技。

本文为机器之心原创,转载请联系本公众号获得授权。

0 人点赞