自AV2标准技术研发工作开展以来,腾讯多媒体实验室团队截止目前共有5项独立编码工具获得开放媒体联盟采纳集成进入AV2参考软件,技术覆盖视频编解码多个核心技术模块,包括帧内编码、变换编码、块划分和环路滤波等。团队累计贡献了AV2标准目前所有采纳技术中超过80%的图像/帧内编码性能增益。
腾讯AV2技术方案的帧内编码性能增益
数据显示,当前互联网中75%以上的流量都来自于视频。5G网络在带宽、时延上的不断提升为超高清视频的全行业普及创造了有利条件。而更高清晰度和更大的码率对视频内容的高效压缩、传输以及分析提出了更高要求。
为了支持和推动这些需求,业界多个多媒体标准工作组正不断推出更加高效的视频编解码技术标准,致力于给用户带来更好的视频体验。其中,由开放媒体联盟Alliance for Open Media( AOMedia,简称AOM )开发的第一代视频编码标准AOMedia Video 1( AV1 )自推出以来获得了产业界巨大关注和支持。而这主要得益于更高的编码效率,同等质量的编码后视频可以节省20%以上的带宽。同时,开源、免版权费的特点也让其推广时没有阻碍,受到众多主流企业的欢迎。腾讯在相关领域的提前布局,腾讯云音视频成为国内首家直播和点播产品同时支持AV1视频处理能力的云厂商。
为进一步大幅提升视频压缩的性能,支持新的业务需求,AOM于2020年起草了下一代视频标准的需求文档,明确了AV2参考软件并制定了通用测试条件,并于2021年初正式开展下一代AV2标准的技术研发工作。AV2标准的研发工作自筹备以来,获得联盟成员的积极参与和支持,贡献者包括AOM的多个核心成员单位,并且与会人员大幅提升,包括全球范围内该领域的多名知名技术专家。下一代AV2标准的研发工作在业界受关注度很高,预期将对AV1的技术方案进行大幅改进,全面提升图像及视频编码性能,未来将对全球范围的多媒体产业格局的产生巨大的影响。
在腾讯多媒体实验室AV2标准组负责人专家研究员赵欣看来:“目前来看,对于下一代的AV2标准的技术研发,腾讯和 Google 的贡献相比其它AOM成员更大,相信能够在下一代AV2标准的技术研发上具有一定的优势。”腾讯多媒体实验室和Google联合组织已经成立了编码技术孵化组(Incubator Group),目前实验室已为AV2推出多项编码技术。
腾讯于2019年10月加入AOM,成为第一家来自中国的董事会成员(其他董事会成员包括Amazon, Apple, Facebook, Google, Netflix和Microsoft等)[1]。自加入联盟以来,腾讯多媒体实验室积极推动并主导AOM的多项工作。
腾讯多媒体实验室团队多人担任AOM工作组(Workgroup/Subgroup)主席,参考软件管理员(Software Coordinator)及多个专项技术小组(Focus Group)主席;团队积极推动下一代AV2的标准化进程,在AOM下一代视频标准的需求文档,参考软件选择和维护,通用测试条件,技术文档编辑等多项核心工作中已经做出了显著的贡献。
上图:AV1(20660 Bytes)
下图:AV1 腾讯AV2技术方案(20550 Bytes)
学术论文方面,腾讯多媒体实验室团队相关工作发表在ICIP2020 [2][3],ICASSP2021 [4],ICME2021 [5],ICIP2021 [6][7]和PCS 2021 [8],其中7篇高质量学术论文被接收。除此之外,团队在ICIP2020 [9]和ICME2021 [10]发起并组织下一代视频编码技术的专题研讨会( Special Session ),并担任多个专题研讨会主席,积极推动该技术领域的进展。
AV1与腾讯AV2技术方案的帧内编码率失真(PSNR)曲线比较
视频编码是视频应用的底层核心技术,其相关标准的制定工作向来都是多媒体领域产业界的兵家必争之地。尤其在后疫情时代,视频通信产业迎来新一轮的突破增长,视频技术领域的发展和创新更显得尤为重要。下一代视频编码标准AV2将为多媒体通信产业界打开新的局面并创造新的机遇,未来腾讯多媒体实验室将继续努力,通过标准制定与核心技术赋能,助力各行业和数字化产业的未来建设与发展。
参考文献
[1]http://aomedia.org/press releases/tencent-joins-the-alliance-for-open-media-at-the-board-level/
[2]L. Zhao, X. Zhao and S. Liu, “Improved Intra Coding Beyond AV1 Using Adaptive Prediction Angles and Reference Lines,” 2020 IEEE International Conference on Image Processing, Abu Dhabi, United Arab Emirates, 2020, pp. 3408-3412.
[3]X. Zhao and S. Liu, “Unified Secondary Transform for Intra Coding Beyond AV1,” 2020 IEEE International Conference on Image Processing (ICIP), Abu Dhabi, United Arab Emirates, 2020, pp. 3393-3397.
[4]Y. Jin, L. Zhao, X. Zhao, S. Liu and A. C. Bovik, “Improved Intra Mode Coding Beyond AV1,” 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2021, pp. 1580-1584.
[5]X. Zhao, L. Zhao, M. Krishnan, Y. Du, S. Liu, D. Mukherjee, Y. Xu, A. Grange, “Study on Coding Tools beyond AV1,” Accepted by 2021 IEEE International Conference on Multimedia and Expo, Jul. 2021.
[6]L. Zhao, X. Zhao and S. Liu, “Semi-Decoupled Partitioning for Video Coding beyond AV1,” Accepted by 2021 IEEE International Conference on Image Processing (ICIP), Sep. 2021, Alaska, USA.
[7]S. Kahu, M. Krishnan, X. Zhao and S. Liu, “Context-Adaptive Secondary Transform for Video Coding,” Accepted by 2021 IEEE International Conference on Image Processing (ICIP), Sep. 2021, Alaska, USA.
[8]X. Zhao, “Video Coding Tool Analysis and Dataset for Gaming Content,” Accepted by the 35th Picture Coding Symposium, Bristol, UK.
[9]Special Session on Novel Coding Tools for the Next Generation Video Coding Format: https://2020.ieeeicip.org/program/special-sessions/novel-coding-tools-for-the-next-generation-video-coding-format/
[10]Special Session on Towards Next-Generation Video Coding Techniques :https://2021.ieeeicme.org/conf_sessions
作者:赵欣
编辑:Xinya