这是华为媒体技术院视频编码优化团队负责人王豪第二次接受LiveVideoStack的采访,王豪认为AI和编码联合优化为视频压缩提供了更多可能,他和他的团队也会在此方面持续投入。同时,他也对MSU视频编码大赛的“主观评分”提出了质疑。
文 / 王豪
策划 / LiveVideoStack
LiveVideoStack:王豪你好,恭喜HW265在2019年MSU视频编码大赛的“客观评分”部分获得第一的成绩。能聊聊过去一年华为Codec团队主要做了哪些工作吗?
王豪:谢谢,过去一年,团队主要聚焦在公有云的编码通用性和竞争力方面:
- 多场景优化:之前HW265主要服务内部客户,所以聚焦在流媒体,IPTV等场景的编码优化,从2018年开始HW265上线公有云,所以我们在多场景优化上投入了大量的精力,对短视频,游戏直播,互动直播,媒资,OTT点播等方向做了针对性的编码优化,编码性能有大幅提升;
- 高清低码持续优化:我们将人眼视觉模型和视频编码更深度地结合,实现同等主观下,压缩率持续提升,相对传统编码,目前码率节省已提升至30%~40%;
- 视频编码与处理联合优化:随着计算平台AI处理能力增强,视频处理和编码联合优化为视频压缩提供了更多的可能,今年我们在这个方向有一些初步探索结果,明年有机会和大家分享一下。
LiveVideoStack:我注意到华为并没有出现在“主观评分”报告中,这是什么原因?
王豪:我觉得MSU主观评测竞赛说服力不是很够,主要原因是评测序列太少(5个视频),同时容易受增强算法的影响,所以在参加之前就决定不公开。就像我在今年4月上海LiveVideoStackCon分享的,虽然去年我们在MSU视频编码大赛主观成绩也是第一,但主观结果同样没公开。
LiveVideoStack:Visionular的AV1Codec在“主观评分”中排名第一,相比于H.265产品有不小的优势。不知道华为是否有计划开发AV1的Codec?
王豪:首先恭喜微帧,这么短时间将AV1优化到现在的性能很不容易,但实话讲,个人对结果是有些疑问的,希望有机会和朱政一起交流下。
我们内部对AV1和HEVC的参考软件有过详细的评测和分析,从压缩率讲,AV1稍优于HEVC,没有明显优势,这是技术上的考虑。同时结合最近中美贸易战的政治影响,我们没有计划对AV1的编解码支持。
LiveVideoStack:2020年将会发布AV2、VVC,你怎么看待视频Codec未来的格局?
王豪:先说结论:视频codec的未来格局必然是群雄争霸的局面,并且在中美贸易战的影响可能出现新的变数。
由于HEVC专利池的各种问题,H.264一家独大的优势不复存在,目前AV1在国外基于谷歌生态的优势,已经在流媒体领域站住了脚跟,形成三强争霸的局面。
对于下一代编码器而言,AV2预计距发布还有一定的时间,这里先不评价,已经发布的AVS3基于当前贸易战的形式下可能有新的机会,而对于EVC和VVC,专利策略将是市场是否接受的关键因素,目前还不好说。
LiveVideoStack:2020也是个体育大年(奥运会和欧洲杯足球赛),也将是5G快速部署和发展的一年,由此将带来超高清视频、VR视频和短视频的又一次爆发,你和你的团队为此正在做哪些工作呢?
王豪:我们觉得5G将会给视频领域带来更多更好玩的场景和体验,催生新的商业模式,从技术层面上,团队正在做如下方面的探索:
- 超低时延编码:我们正在进行4k/8k超低时延编码器的开发和优化,为云游戏,VR,多屏互动提供更优的体验;
- 视频编码与处理联合优化:我们将这个方向上持续突破,将编码与处理深度融合,实现极致的视频压缩效果;
- 下一代编码器优化:我们已经在投入下一代编码器的优化工作,预计明年下半年会有满足点播场景的商用档位提供出来。