搜狗AI合成主播再次进化,发布站立式合成主播

2019-04-23 15:57:02 浏览数 (1)

晓查 发自 凹非寺 量子位出品 | 公众号 QbitAI

这一次,新闻主播的“失业危机”,连新华社主播自己都开始担心起来。

因为搜狗AI,又给演播室带来了新员工。

去年12月乌镇世界互联网大会,搜狗和新华社就联手推出了全球首个AI合成主播

现在,3个月后,这个AI主播不仅能“坐在”演播室,开始替代人类播报新闻。还能“手舞足蹈”,运用起肢体语言丰富表达了。

没错,肢体语言,就是搜狗和新华社赋予AI合成主播的最新技能。

2月19日下午,搜狗与新华社新媒体中心达成战略合作,双方在签约仪式上联合发布了站立式AI合成主播,让它站起来用更生动的方式播报新闻。

3个月后再度进化

去年11月世界互联网大会期间,搜狗的全球首个AI合成主播初次亮相,负责为新华社播报大会相关新闻。

它的出现引发国内外多家媒体关注,包括路透社、华盛顿邮报都对此进行了报道,搜狗也成为了中国展示AI技术实力的窗口。

AI合成主播并不仅仅只在世界互联网大会上登台,还报道了首届进博会、2019年春运等热门话题,今年还计划让他来播报2019两会新闻。

搜狗方面表示,3个月来AI合成主播已生产了3400余条新闻报道,累计时长达10000多分钟。

如今,这个“男主播”不仅能站起来,还有了自己的名字——“新小浩”。这让它的原型,也就是新华社主播邱浩倍感压力。

今天发布的新AI合成主播,将过去的“坐着播新闻”升级成结合肢体动作的“站立式播报”,标志着“搜狗分身”技术再次取得突破。

在此次发布会上,搜狗还为“新小浩”带来了一位新同事:全球首个AI合成女主播“新小萌”。它展示了“搜狗分身”技术的通用能力,可以根据不同的要求复制AI合成主播“分身”。

AI主播背后的技术

搜狗AI合成主播师从国内顶级新闻播报员,由新华社邱浩和屈萌两位主播“亲自”调教。

它是对真人主播声音、唇形、表情动作等特征进行高效提取,通过语音合成、唇形合成、表情合成以及深度学习等技术,创造出具备和真人主播一样播报能力的AI合成主播。

这项技术让机器首次做到逼真的模拟人类说话时的声音、嘴唇动作和表情,如今搜狗又将合成肢体语言的能力加入其中。

同时,“搜狗分身”的个性化定制成本低,仅需使用少量用户真实音视频数据,即可快速定制出高逼真度的分身模型。搜狗仅在3个月后就推出了完成度极高的“新小萌”形象,再次证明了这项的技术的通用性。

除了加入新功能,搜狗还对AI合成主播原本的声音、图像技术进行升级。

“新小浩”的声音加入了领先的wavernn波形建模技术,实现更逼真的语音合成效果,让声音情感更真实。

在图像生成方面,通过模型优化及多风格数据的使用,实现更加逼真的表情合成、肢体动作与语义的恰当匹配以及更加自然的唇动效果。

未来应用场景

站立式AI合成主播将打破只能在演播室的局限,将“走出大门”参与2019年全国两会的报道,站立并且声情并茂为观众播报前方消息。

今后,搜狗和新华社将以AI合成主播项目为核心,在人工智能应用于新闻采编领域开展全方位长期合作,你可以在新华社客户端、微信公众号上看到两位主播的身影。

搜狗CEO王小川还介绍说,除了在新闻领域的应用,作为AI合成主播的技术核心,“搜狗分身”技术未来还将应用于娱乐、医疗、健康、教育、法律、金融等多个领域。

作者系网易新闻·网易号“各有态度”签约作者

0 人点赞