2020年疫情的突如其来,让数字通信手段成为了人与人沟通的重要手段。从各地政府的抗疫行动部署,到基础行业的维持运行,再到企业复工后的生产安排,都离不开在线会议等重要数字化协同工具,同时也对实时音视频通信的稳定性和通讯效果提供了极大考验。
作为最受欢迎的在线会议软件之一,腾讯会议基于高清、稳定、安全的视频会议服务,上线两个月内日活跃账户数就超过1000万,成为中国最多人使用的视频会议产品。其赢得用户青睐背后,是腾讯过去二十余年在音视频通讯领域的经验和技术能力积累。
腾讯多媒体实验室的高级总监商世东
在日前举办的腾讯全球数字生态大会上,来自腾讯多媒体实验室的高级总监商世东分享了腾讯会议这款亿级音视频通话产品高速成长背后的技术密码,并发布了腾讯“面向实时音视频应用的新一代实时音频技术品牌”——腾讯天籁。商世东表示,为了解决实时音视频应用场景下的各种挑战,腾讯天籁围绕着”听得见,听得清,听得真“目标,构建了一整套围绕音频通信核心体验的技术和框架。
一、腾讯天籁,直面后疫情时代的实时通话挑战
在腾讯全球数字生态大会的分享中,商世东坦言:实时的音视频会议,从一开始面临着非常大的挑战。具体的难点包括:接入设备的差异性、接入场景的复杂化、通话环境的多样化、多人同场地通话、噪声消除,以及网络环境的稳定性等等。
究竟用户是使用笔记本还是手机、使用Wi-Fi还是5G、是在安静的家中还是嘈杂的路边、是自己一个人还是一堆人扎堆开会,都有可能导致会议体验不佳。此次腾讯全新发布的“腾讯天籁”解决方案,旨在提供实时端到端音频通信的完整解决方案,致力于让用户在实时音视频会议时可以“听得见,听得清,听得真”。
例如在音质方面,腾讯会议就扩展了实时音频的语音带宽,相比传统PSTN电话的音质沉闷、线路杂音、环境嘈杂,腾讯会议中的音频音质名亮、语音干净、背景声音也更加安静。同时,整套音频算法能力也进行了有针对性的优化,可以在用户多种客户端进行部署。
围绕多人通信场景的AI音频优化则是另外一个方面,通过将经典的音频信号处理和深度学习技术结合,并且利用大数据训练,定制面向客户端和服务器的多样化模型。“腾讯天籁”能够在原有采集的音频基础上,分辨出实际的声音场景,并且通过处理将各种噪音、背景声直接去除。
二、二十余年音视频通讯技术积累,助力腾讯会议快速成长
腾讯天籁技术方案的的可靠性,已经在腾讯会议等国民级产品中获得了有效验证,成为腾讯会议高速成长背后的技术密码,助力腾讯会议上线两个月内日活跃账户数就超过1000万。
今年4月,联合国宣布与腾讯达成全球合作伙伴关系,并借助腾讯会议、企业微信等工具将联合国75周年(UN75)数千场活动搬到线上进行。这场迄今为止规模最大的全球对话之所以会选择中国互联网企业的技术护航下全面展开,恰恰是因为腾讯自身深厚的技术积累。
借助腾讯多媒体实验室多年来在音视频通讯的经验积累,以及腾讯云遍布全球的低延迟网络,腾讯会议国际版已在超过100个国家和地区上线,并且还免费开放300人同时在线的会议能力,助力全球战疫。腾讯多媒体实验室提供的音视频技术,也是腾讯会议为UN75周年活动提供灵活、稳定、安全的在线会议解决方案的重要支撑之一。
作为腾讯旗下顶尖的音视频通信和处理研发团队,腾讯多媒体实验室专注于实时音视频通信、音视频编解码前沿算法研究、音视频国际标准、计算机视觉图像处理、端到端音视频质量评测。
三、加速推进天籁音频技术落地,打造5G时代沉浸式体验
发布腾讯天籁技术品牌,腾讯致力于推动新一代实时音频技术的更广泛场景应用。据商世东介绍,目前腾讯天籁技术已经在腾讯会议、企业微信群直播应用中落地,助力相关应用在音视频体验方面取得了良好的用户口碑。未来,腾讯天籁技术也将接入腾讯旗下金融、政务、教育等行业场景下的实时音视频需求。
在5G浪潮下,多媒体的技术和形式不断发生改变,高效率低延迟的传输,带来了更丰富的落地场景。腾讯天籁音频技术也将会加速在融媒体、新媒体等更多更丰富的场景落地,为用户带来极具5G时代色彩的沉浸式体验。