我们为什么叫「递归」
“递归” (recursion) 是一种在程序设计语言中被广泛使用的算法。它有两大特点,一是调用自己,二是化繁为简。我们当中那些优秀的技术人又何尝不是如此?他们以身作则,用实际行动影响身边的人,规范了流程、提高了效能,使整个团队从中得益。这就是我们「递归」栏目的初心,记录平凡腾讯技术人的不平凡。
语言的存在使人类可以集思广益、通力协作,最终达成目标。而语言差异不仅带来沟通障碍,甚至会影响地域的发展。在腾讯有这么一个技术团队,他们专注于少数民族语言与汉语的互译研究,致力于解决民汉语言差异所带来的交流问题。尽管语料资源稀缺,他们探索脚步不停,多次深入边疆一线对民族语言相关资源进行采集。最终诞生了这款产品——《腾讯民汉翻译》,使民族同胞之间更加了解彼此,也给边疆地区人民生活带来极大便利。让我们透过几位核心成员最初的经历走进这个团队,去了解他们的坚持和追寻,以及“让科技有温度”的火热信念。
腾讯民汉翻译团队:集合来自低资源场景下语音识别,语音合成,OCR识别,机器翻译四个领域顶尖工程师的业界知名小语种智能技术研发团队,其研发的《腾讯民汉翻译》产品成为业界首次实现民族语言“实时语音识别 标点断句纠错 合成翻译”和“全自动拍照翻译”的现象级产品,在边疆地区群众,驻村干部,语言学习者中获得广泛应用和好评,为民族交流搭建了桥梁。团队成员也来自于藏,维,蒙,回,满等多个民族,却象石榴籽一样紧紧团结在一起,是腾讯内部一支特别的多民族、多语言核心技术团队。
是什么产品让他们如此尽心竭力
黄申:《腾讯民汉翻译》不仅可以识别日常的对话,同时也可以识别边疆地区的人名、地名、机构名。现在已经成为国内首个在蒙、藏、维、哈、朝、彝、壮等多个民族语言中实现语音同声传译、图像实时翻译的交流工具。
《腾讯民汉翻译》小程序推出后,得到了众多的组织和机构的认可,并在国内外各大学术和产业竞赛中获奖无数。
两个人的团战 追求极致的较量
胡博杰:加入腾讯民汉翻译团队以来,接到的最大的一个任务就是世界机器翻译大赛(WMT)。当时参加该比赛的都是世界级的一线梯队。当时他们已经准备很长时间了,而且都是一个团队在作战。我们只有两个人,只有比别人做的更多、要更努力更拼一些,才能跟别的团队在一个水平线上作较量。
阿敏:困的时候,我们就会在工位附近跑步,用凉水洗洗脸。如果还是不行我们会接着跑,如此往复。因为我们都知道这是一个非常关键的时刻,任何人都马虎不得。
每一段经历 都是成长的养分
胡博杰:从研究生开始,我主要从事机器翻译的相关研究。刚进实验室,我导师给我安排的是统计机器翻译的最小错误率训练,也就是MERT的研究,当时一直在实验室踏踏实实的做研究。
尽管这么辛苦,当时还是很惶恐。因为就好像你睡了一觉整个世界都变了一样——身边的所有人,学弟学妹、师兄师姐,企业界和工业界,都已经从统计机器翻译转到神经机器翻译,只有我当时还在研究统计机器翻译。感觉自己研究的东西太落后了,但我还是坚持了下来。
直到有一个机会,被导师派到了腾讯翻译君实习。正因为有统计机器翻译的这段研究经历,我很快就上手了神经机器翻译,甚至比那些比我研究NMT还早的学弟学妹和师兄师姐们更快地上手。
所以你的每一段经历都会成为你下一段经历的基石,成长是看不见的。你只有认真对待每一件事,才可能在机会来临时牢牢握住。
只为追寻改变现状的初心
阿敏:当时我们在课上都是用蒙语去授课,除了英语和汉语外,其它的科目都会使用蒙语去书写我们的卷子,包括最后高考的卷子。但是这里有一个问题就是,书店中卖的很多材料,包括网上的学习资料都是使用汉语书写。这就导致了很多汉语不好的学生可能很难去做课下的练习,包括他们的学习效率可能会大大地降低。
所以慢慢的我就在想,我以后有没有机会去帮助更多国内少数民族同胞和同学,让他们去更努力的学习汉语。而现在,我觉得我正在为这个目标而努力。
我的信仰
胡博杰:无论工作生活,遇到再多的挫败,都应该保持一颗怒放的、积极的、善良的、温暖的内心去应对。如果说在追求技术极致的路上,碰到很多荆棘和不期的挫败是我眼前的苟且的话,那么让技术有温度、有价值的这款产品——《腾讯民汉翻译》,就是我心中的诗和远方。
阿敏:雨果说,别人放手他仍然坚持;别人后退他仍然向前冲。每次跌倒他立刻都能站起来,这种人一定没有失败。对我来说现在也只是困难的开始,在未来还有很多的困难在等我。不过我会一直坚持。砥砺前行,实现自己最终的目标。
看完了腾讯民汉翻译团队成员的故事,你有什么想对他们说的,快快留言告诉我吧!我们将选出三位幸运读者,送出精美礼物一份。
导演:陈银华
嘉宾:黄申,胡博杰,阿敏巴雅尔
监制:xingjiaxie, barnettsun, tinggwu
后期指导:paulinesong, kylinlu
特别鸣谢:腾讯民汉翻译团队