“主人,妲己开始为您导航;”
“主人别急,这里可能被坦克堵住了;”
“前方有限速摄像,限速80,疾跑技能请关闭。”
“路漫漫其修远兮,路上不要玩手机;”
“时刻系牢安全带,一起奔向新时代。”
......
当游戏中妲己温柔娇美的声音在耳边响起,摇身一变成为你爱车的导航员;当导航念出Rap范儿,轻松有趣,句句是梗,你还会在为漫长旅途、各种堵车感到枯燥无味吗?
从热门游戏角色到社会名人明星语音导航、播报,这些爆火的语音功能背后都有着相同的AI技术支持:语音合成(TTS)。
01
合成能力「更进一步」
2021年7月5日,腾讯云AI语音合成上线了2项能力更新:长文本语音合成与旁对白区分。
怎么理解呢?
据相关产品经理介绍:“此次更新的长文本语音合成可以一次性合成较长文本,突破以往字符数的限制,10万字符以内的文本可以轻松搞定,极大减轻客户的开发成本。同时支持通过异步方式返回合成结果,自主调节语速和音量,提供多种音色适配各类文案,模仿人声真实、停顿自然,完美贴合阅读播报、新闻媒体等场景,为企业降本增效。”
“而旁对白区分则是业内首创,可以全自动地将旁白对白按照不同风格进行流畅播报,交流更具情景化,对话场景活灵活现,为用户带来全新沉浸式阅读体验。”
而在早期的合成系统中,要实现这样的效果,除了技术的要求,大多还需要大量的专家知识,对发音或者声学参数进行调整,不但费时费力,成本高,而且难以满足对不同上下文的覆盖,也在一定程度上影响技术的商业化实施。
如果再更进一步,在NLP技术海量数据训练加持下,还可以提升合成文本的焦点、情绪、语气、语调等更精细化的拟人效果。
而针对传统音色千篇一律、枯燥雷同的问题,腾讯云AI语音合成依托微信智聆端到端的深度学习技术可以更快、更高效地训练音色,为企业量身定制专属客服音色,助力企业打造独一无二的服务和品牌。
深耕AI领域多年,经过腾讯地图、微信读书、QQ浏览器、Webank等大流量产品充分验证,腾讯云AI语音合成在有声阅读、智能客服、新闻播报、车载导航、游戏角色变声等多样的应用场景积累了丰富的实践案例。
02
好声音「引领潮流」
如果说产品代表服务用户的能力,声音就是让用户享受服务时的最佳沟通介质。
对大部分人来说,阅读是日常生活、工作中广泛且长期的需求,特别是热衷电子小说的,对“听书”一定很熟悉。很多内容平台在增强阅读体验方面,打破传统“看文字”的阅读方式,为用户提供有声小说功能,通过“听书”让用户在休闲、驾车、跑步过程中依然可以获得独特的阅读体验。
从“看”到“听”的转换,除了带来更好的阅读体验与信息获取方式,甚至会彻底改变平台玩法和商业模式。
不仅是阅读,还有很多现实可以触及的。
在教育方面,尤其是语言教育方面,目前的教育方式中,想学到标准的发音和持续训练,需要大量人力、资金成本。随着语音合成技术的应用涌现,一方面可以大大增加有声教育素材库,另一方面,甚至可以部分取代真人对话的教育内容和场景。
配音领域,利用语音合成技术,可以大大降低配音的成本和周期,选择性也更多;短视频制作可以选择各种音色为视频配上有趣的声音来展现内容;虚拟主持人利用语音合成技术,可以提升信息的传播时效性,同时大大缓解主持人的工作压力,降低其工作强度。
而在上一期的文章《初音未来、洛天依、镜音......揭秘虚拟歌姬背后的大BOSS》中我们也提到过虚拟歌姬,在未来,基于AI语音技术的虚拟IP也许会成为一个新的风口。
尽管语音导航、有声小说等并不是产品的核心功能,但往往能在核心功能外和年轻群体中收到奇效,引领一波潮流;不仅可以带来显著的流量增长,也带来了优质的用户群体和提高留存率。
从历史视角看,不管是空间障碍还是语言障碍,语音交互都将是促进和增强人与人、人与机器自然对话的强大工具;技术的进步也会不断冲破原有的障碍,满足越来越多的用户需求,使得更创新的应用不断涌现,实现用声音改变生活的美好愿景!
最后墙裂安利!本次更新在语音识别(ASR)方面也新增了「南京话、南昌话、四川话」等方言能力,满足企业更多业务场景,有需要的可以在官网填写申请,优先体验哦!
更多腾讯AI产品体验与合作联系
欢迎识别下方小程序码进入
燃烧的“蚂蚁呀嘿”同款,你get了吗?| 报告!我可能被偷袭了...... | 那个心心念念的盛世美颜来了 | 后疫情时代的智慧旅游景区,从打造入口开始!| 提到盛世美颜,你最先想到的是?| 一张报销单引发的"吐槽大会" | 初音未来、洛天依、镜音......揭秘虚拟歌姬背后的大BOSS | 抠图,令我苦不堪言! | 戳中打工人的爽点,3步就够了 | AI会是考试作弊的终结者吗?| 腾讯云AI「 承包了一片海 」| 久违了,我我我我的童年照!| 劳模打字人,走出另一条路 | 宝!AI来给你发对象了 | 腾讯云AI「开了一个脑洞」|