极速高清:让视频更小更清晰,迈向高品质视频

2020-11-06 09:40:10 浏览数 (1)

| 导语  视频是当前网络媒体主要形式和网络带宽资源的主要消耗者。通过降低分辨率和增加压缩比率,人们可以将视频以较小的网络带宽消耗进行传输,但降质传输的视频画质效果很影响用户观看体验。因此如何让视频以更小的带宽传输,再通过修复增强算法恢复出高清画质,实现“美”的共享,给视频技术提出了新的挑战。在此背景下,极速高清团队以低带宽占用下为用户提供更好的视频体验为目标,提出了包括画质修复与增强、内容自适应参数选择、高质量编码器等一整套视频处理解决方案。其中,在画质增强修复中提出的“AR-SR”方案,在AIIA 2020人工智能开发者大会专项赛事旷视超分辨率大赛中取得冠军,下面带来关于“AR-SR”方案的技术分享。

(左:受损画质 右:AR-SR提升结果)

“AR-SR”网络设计结合汇聚层及空间注意力机制,充分挖掘压缩失真和纹理的模式信息,并依据对压缩失真和纹理的分析,在SOTA的RIR(residual in residual)结构上进一步改进,在合理的层数设计上添加了内外两层跳跃连接,提高了网络模型的稳定性。并提出解耦信噪特征损失函数(disentangled loss),通过端到端地引导网络对伪影和纹理加以区分,增加网络可控与可解释性的同时,让网络拥有良好的伪影去除及边缘保持特性,保证客观指标得分的前提下,能够进一步提升画质主观效果。

01

AR-SR结构设计

在结构设计上,“AR-SR"具有以下几个特点。

  • 多级汇聚层:网络主干使用了残差内残差的baseline结构,创新地在内外层的两级残差均添加了汇聚层模块,用于充分挖掘浅层、中层信息,即压缩失真和纹理的模式。这是很多现有算法忽略到的部分。
  • 轻量像素注意力:使用了轻量级模块提取像素注意力。该模块与汇聚层结合能更好地挖掘特征中的信息,减少参数冗余。研究发现汇聚层和注意力机制的作用有1 1>2的效应。
  • 多帧融合:时移模块(Temporal shift),该模块是一种轻量的时域信息迁移模块。相关成果比较新,目前还很少有在底层视觉运用,唯一接近的工作是图像修补。
  • 子像素提取模块:像素重新排列,相较转置卷积速度更快,且没有棋盘效应。
  • 压缩失真和纹理分析:分析了退化数据的压缩伪影和真实纹理的分布和模式,通过可视化(如下图右侧)像素误差信息,添加必要的连接(下图左侧),让网络更好辨别二者。
  • 模型选择:通过分析模型效果的方差,挑选出泛化能力更强的模型。该方法简单有效,在实际应用中经常采取该策略。

每个技术点的实际收益如下图所示,可以看到多级汇聚技术带来的收益最为明显。

“AR-SR”网络模块设计灵活,以此为基础,后续很方便改造为高效的、适用多种降质任务的轻量网络。

02

AR-SR损失函数设计

一直以来,AI技术的可控性和可解释性都是比较差的,因此深度学习也常常给与人们一种捉摸不透的“黑盒子“印象。现有超分辨率算法在遇到严重的噪声/伪影干扰时,表现性能会大幅下降。具体表现为会放大噪声/伪影等错误的高频信息,产生严重影响观感的bad case。同时现有数据驱动的去压缩失真、去噪算法也伴随着像素平均化的影响,出现over-smooth的现象。

团队设计了“对症下药“的解耦信噪特征损失函数(disentangled loss),根据编解码知识的先验,使得网络可以智能感知编码量化带来的块效应、振铃效应以及各种复杂的伪影现象,如下图所示,黑色标记为失真伪影。

解耦信噪特征损失函数(disentangled loss),通过端到端地引导网络去区分像素属于伪影还是纹理,增加网络的可控与可解释性。其他算法(包括编解码的环路滤波、传统图像算法、现有state-of-the-art的深度学习网络)没有足够可靠的机制与统一的公式去判断压缩块的边界是量化产生还是真实就有的。借助这项自研的像素区域分类损失,和像素级重建损失结合,这项技术不仅能够在测试数据上展现明显领先的客观指标分数,同时能大大缓解over-smooth的现象,取得了“黑科技“般的主观效果。

(左:受损画质 右:AR-SR提升结果)

(左:受损画质 右:AR-SR提升结果)

同时,“AR-SR”是深度学习技术和编解码先验知识结合的一次实践。团队下一步的计划是在传统图像处理、视频编解码的先验知识中挖掘更多可供利用的信息,指导网络结构的设计,使其更高效可控。这是目前网络结构搜索(NAS)等方式所不具备的能力。

03

算法意义

往往视频上行路线中,受限于用户拍摄条件有限或上行网络带宽限制,需要对拍摄源视频降低分辨率、使用较低码率压缩,或经历多次的压缩过程,从而给视频带来了很大的采样损失和量化损失,很大程度影响用户观感体验。对于这种场景,可以在转码端对源视频使用团队改造后“AR-SR”方案进行画质提升,修复压缩带来的损耗和恢复原分辨率信号,给下行用户提供高画质的视频流。

04

画质技术

极速高清包括画质修复与增强、内容自适应参数选择、高质量编码器等一整套视频处理解决方案,挑战编码极限,在最低的码率情况下提升视频的主观画质体验,让视频更小更清晰。

画质提升技术:结合编码、传统算法、AI算法的多种自适应视频画质提升技术,一方面去除多余噪声,节省码率,另一方面提升视频画质,加大码率压缩空间,为编码器提供一个更好的输入源,辅助编码器输出低码率高画质的压缩效果。

▼近期热文▼

用户访谈(一):如何做好访谈前的准备工作

用户访谈(二):如何进行一场有效的访谈?

渠道质量评估模型

喜欢本文?快点“在看”支持一下

0 人点赞