本文为媒矿工厂编译的技术文章
原标题:THE SINGLE CRITICAL FACTOR FOR HIGH-QUALITY STREAMING, NOW AND FOREVER
原文链接:https://www.ateme.com/the-single-critical-factor-for-high-quality-streaming-now-and-forever/
翻译整理:黄韦嘉
引言
尽管广播公司、付费电视运营商和OTT流媒体服务的视频内容和业务模式各不相同,但是它们都必须完成压缩视频并将其无损传输到各个用户的任务。本文将会针对这一复杂且重要的任务,阐述ATEME面向未来的解决方法。本帖译自ATEME白皮书:现在与未来,高质量流媒体的关键因素。
全文结构
第一部分主要介绍了流视频的用户反馈和ATEME在ABR编码表现上的关键因素:编码流水线的全堆栈控制。第二部分介绍了多个创新技术,包括:a、感知质量指标;b、动态的、单位场景的内容自适应编码;c、用于实时和点播内容的采用AQI的先进比率控制。最后介绍了一些新的质量最优化方法。
第一部分:流视频质量最优化
首先阐述了分析用户反馈数据的意义。越把视频压缩越可以降低存储和带宽成本;但是同时会降低视频质量,影响用户体验。所以至少应该从理论上分析用户对视频质量的反馈数据。基于这些数据可以建立一个通用的视频质量智能系统的平台。
其次论述了ATEME实现的方式,即对整个编码管道的全堆栈控制。采取全堆栈控制有几个优点:
a、运行ATEME独特的编解码器。它使视频工程师可以自由地使用主观视频测试,Golden Eye视频测试和真实用户反馈来优化所有内容;
b、全堆栈控制不仅可以访问核心压缩引擎,还意味着得到不同算法的结构关系,并用弹性和有效的方式在所有商业编码器中轻松转换和实现数学方法;
c、全堆栈控制的优势还包括编解码器的多样性,以及在更高效的压缩和更优化的ABR配置文件方面的进步。
最后介绍了几个创新亮点,包括机器学习、感知质量和单位场景编码。
第二部分:ATEME质量指数
首先说明了质量度量标准的一些限制,包括:a、使用监督学习模型来调整质量度量的方法(包括VMAF以及ATEME质量指数)强烈依赖于特定训练集和其对内容库的适用性;b、这些指标往往取决于与符合ITU标准的主观视频质量测试的相关程度;c、许多视频质量度量标准没有加入色度特征。
其次提出了ATEME质量指数(AQI),它不依赖于单一指标并且把连续反馈数据分析并集成到编码平台中。AQI是一个五个维度、基于心理视觉的视频质量指标。它采用了标签、监督学习、回归和非线性方程等方法,用于预测和估计一个已编码视频的感知质量。这五个维度分别是:
a、编码质量,在考虑其他因素之前反映原始编码器效率的客观度量;
b、空间指数,描述分辨率下采样与观看参数和内容空间特征所引起的预期质量损失的向量;
c、时间指数,在给定某些观察参数的情况下,利用内容运动分析来描述帧率降低影响的向量;
d、动态范围指数,它计算图片中最亮和最暗部分之间的比率以及对色调映射HDR内容到SDR格式的感知质量的影响;
e、色域指数,它描述了与内容颜色特征相关的变换将怎样影响输出的感知质量。
AQI指数将问题分解成五个部分来定义一个训练集,提取相关特征并手动注释,再通过机器学习来训练。AQI指数利用问题分解和特征选择使其更合理,它是质量指数向量和覆盖视角的函数。
然后介绍了内容自适应比特率阶梯结构。针对基于文件的VOD内容,ATEME编码器采用统计采样技术实现高速首播;针对实时内容,该过程更依赖于编码时的先进比特率控制。
最后介绍了AQI驱动的先进比率控制技术。先进ABR编码是编码器高效分配比特表示视频的核心能力。ATEME实时和基于文件的ABR内容自适应编码技术使用一个基于AQI的内循环,加以可变的比特率和动态的恒定质量调整。这使得编码器能够实现指定的平均比特率,同时针对更复杂的内容来优化比特的分配。
总结:视频流质量优化之后是什么
接下来五年在流媒体将有大量创新的机会,包括新的视频编解码器、内容格式、分辨率和最优化技术。编码平台的全堆栈控制可以持续执行所有先进质量和编码优化技术。它已经成为众多新的优化方法中的尖端技术,令人注目的技术包括:低延迟流、单位场景的组块、更好的帧速率处理。