讯飞翻译超英语六级挑战专业八级,胡郁:做翻译承载文化交流使命

2018-05-29 15:29:49 浏览数 (1)


新智元报道

作者:张乾

【新智元导读】今天,科大讯飞翻译机2.0版本全网开售。新版本增加了摄像头和屏幕,能够对中文与33种国外语言进行即时互译,目前支持国内四川话、广东话、东北话、河南话4种方言,功能强大。胡郁说,讯飞做翻译不是要做一个产品、一项技术或者是一个服务,它是在建立在我们在技术创新,能够改变人类世界坚定信念下的一个长期事业。

下一步,超越专八。

4月20日,科大讯飞执行总裁胡郁在“科大讯飞翻译战略暨新品上市发布会”上宣布,讯飞翻译已经超越中国大学英语6级(CET6)水平。

CET六级翻译题满分15分,科大讯飞机器得分12分,超过大多数人类考生。胡郁说,下一步是超越英语专八。

集讯飞翻译技术大成的翻译机也在当天推出第二代产品,新品于今天正式全网开售。第二代产品的一个重大更新是增加了摄像头和屏幕,不仅可以实现拍照翻译,还能够让AI助理在更多的场景中发挥作用。

视频为翻译机2.0版本巧妙回答人类问题↓

视频内容

规则翻译是傻子,统计翻译是疯子,只有运用人工神经网络才是突破口

胡郁首先回顾了机器翻译技术的演进历史:

  • 80年代前后基于规则机器翻译占据主流;
  • 90年代统计机器翻译技术;
  • 2011年开始神经网络技术快速发展。

规则翻译是个傻子,而统计机器翻译是个疯子,为什么这么说?因为规则性的机器翻译,如果你不告诉它规则,它就什么都翻不出来,所以有时候显得很傻。

统计机器翻译,因为它是采用统计的方法,所以对于任意的机器翻译的句子输入以后,它都能把它翻译成另外一种语言,但是因为统计的语料覆盖,很多情况可能机器没看过,他就会经常的自言自语,说疯话,所以很多翻译出来的东西让你啼笑皆非。

得益于神经网络的崛起,让翻译在“傻子”“疯子”之外,开辟了一条新路。

胡郁说,科大讯飞与谷歌是最早将深度神经网络用在语音识别、语音合成上,创新性地在先期的统计模式识别的语音翻译中间用上了基于深度神经网络的语言模型,最早做出了当时中英文翻译最好的系统。

全双工语音翻译系统加持,超越英语六级挑战专八

在翻译中最难解决的几个难题,除了语音识别、合成等相关的部分外,还面临词汇的复杂性和句式的复杂性

讯飞把attention based neural network(基于注意力的神经网络)模型用在翻译上,取得了非常好的效果,它能自动地获取字的匹配和词的匹配,以及句子中顺序的匹配。对于字,采用CLASS语言解耦合方案解决实体词稀疏性难题;对于句,采用重构的训练目标准则缓解复杂句式漏翻问题。

2017年,科大讯飞在业界首次推出全双工语音翻译系统,全双工是通过语义和场景的理解,来进行无间隔持续翻译工作。这个系统被纳入到讯飞翻译的AIUI中,让讯飞翻译整体技能增强,包括全双工、交互、多轮对话、自动语种识别多语言的语种合成等各个方面。

目前,讯飞翻译已经超越中国大学英语6级(CET6)水平。CET六级翻译题满分15分,科大讯飞机器得分12分,超过大多数人类考生。胡郁说,下一步,讯飞翻译的目标是超越专八。

此外,讯飞已还凭借这些技术获得了了多个国际比赛大奖。

  • 第四届国际多通道语音分离和识别大赛(CHiME-4)全部三个项目第一;
  • 国际语音合成大赛12年连续国际第一;
  • 2016国际知识图谱构建大赛(NIST TAC Knowledge Base Population)核心任务冠亚军;
  • SQuAD机器阅读理解大赛三次刷新国际记录。

定义旗舰翻译4大标准,加量不加价

在发布会上胡郁还公布了讯飞翻译机一代2017年的成绩单:20万台销量,覆盖137个国家,服务2000万次数人群,用户好评98%。而作为开拓者,一代翻译机还定义了A.I.旗舰翻译四大标准:听得清、听得懂、译得准,发音美。

在翻译机这样一个高度垂直的市场里,能卖出20万台设备实属不易。胡郁说,未来,讯飞翻译将根据场景细分,打造翻译全场景产品体系,面向行业的是“听见”,“听见”的使用场景为会议记录、视频直播、大会上屏。面向消费者的就是翻译机。

讯飞翻译机产品经理翟吉博说,翻译机二代产品的更新,也体现了这一理念。

首先是增加屏幕和摄像头

现在,仅靠语音互译已经满足不了人们的需求,翻译机二代产品增加拍照翻译功能,能够对菜单、路牌、说明书等内容进行拍照翻译。并对各种印刷体、英文手写体也能很好识别,支持11种语言。

其次是方言翻译,目前能够支持的方言包括粤语、四川话、河南话、东北话4种主流方言,后续还将继续升级;其对带口音的普通话整体识别率达到95%。

第三是离线翻译。首创多语种NMT离线翻译引擎,离线在线无缝切换;目前支持中英离线翻译,目标是在2018年世界杯之前,中俄互译在线离线功能上线。

第四是中文与全球33种语言即时互译。讯飞认为,这33种语言能够解决95%的中国出境游用户场景需求。

第五是提供移动流量解决方案。支持WIFI、4G、免SIM卡上网、一键开启热点等功能。

此外,AI助手也能在翻译机中体现,针对景区、交通站点等特定场景提供服务,并支持设备系统在线升级。

更新后的翻译机2.0版本有星辰黑、香槟金、樱花粉三色可选,售价与一代一样,都是2999元人民币。

做翻译机的大逻辑:不是做产品、技术或服务,是承载文化交流的使命

运算智能、感知智能、运动智能、认知智能是科大讯飞认为的人工智能发展的几个阶段,胡郁说,语言和语言之间的翻译是促进人类融合成一个大的智能体的必要过程,是认知智能的一个重大突破。

“科大讯飞做翻译,不是要做一个产品、一项技术或者是一个服务,它是在建立在我们在技术创新,能够改变人类世界坚定信念下的一个长期事业。”胡郁说。

讯飞目前正在实施人类语言大互通计划,语言翻译将成为中国国际化、全球化中间一个非常重要的支撑。讯飞还与国际电信联盟、上海外国语大学、东北大学等合作,共同推动翻译事业的发展。

而讯飞当初翻译机出于何种目的?

胡郁说,最开始是援疆援藏过程中产生的语言互译需求,2016年11月发布翻译机1.0产品,此后便一发不可收拾,成为人们出国旅行、交流的利器。在今年的博鳌亚洲论坛上,讯飞翻译机成为官方指定翻译机,被作为“国礼”赠送给荷兰首相。

另一方面,跟手机上的翻译软件相比,翻译机的优势有:抗噪拾音,还原真实场景;随时随地一键开启翻译;独立硬件,拉近彼此距离。因此在一定程度上是用户刚需。

最后,谈到AI翻译能否取代人类的问题,胡郁认为,翻译目前还难以突破文化、生活、知识等限制,无法取代人类,而最终也将成为人类的助手。

去年10月,讯飞与上海外国语大学建立联合实验室,高翻人员使用讯飞听见,对翻译活动有很大帮助。上海外国语大学高翻学院副院长吴刚也来到了发布会现场,吴刚说,面对新技术的时候不要恐惧或反对,做一个实验者,在AI新时代,翻译者要调整心态,找到新的定位,探索人机耦合,把翻译事业推向高峰。

0 人点赞