客观评价指标
客观质量评价主要分三个方向:
- 全参考 (Full-Reference):属于有源评价。
- 部分参考 (Reduced-Reference):属于有源评价。
- 无参考 (No-Reference):属于无源评价,学术界的研究重点,主要分为传统的特征提取和机器学习。
常见的全参考客观评价指标有:
- PSNR (Peak Signal-to-Noise Ratio)
- SSIM (Structural Similarity Index Measure)
- VMAF (Video Multi-Method Assessment Fusion)
其他不常用的全参考客观评价指标举例:
- MSE (Mean Square Error)
- MS-SSIM (Multi Scale Structural Similarity Index)
- JND (Just Noticeable Difference)
PSNR
峰值信噪比 (PSNR) 表示信号最大功率与影响精度的噪声功率的比值,单位为分贝 (dB) 。一般用的最多,缺点有时候分数与人眼观感差距较大,因为 PSNR 没有考虑亮度、结构等信息对于视频质量的影响,故后续也出现了 HDR-PSNR 等方法。
PSNR 通过均方误差 (MSE) 计算而来,MAX 为图像所有像素点颜色数值的最大值。其中MSE公式如下:
begin{aligned} MSE=frac{1}{m n} sum_{i=0}^{m-1} sum_{j=0}^{n-1}[I(i, j)-K(i, j)]^{2} end{aligned}
RGB(彩色)图像的 PSNR 计算公式如下:
begin{aligned} PSNR=10 cdot log _{10}left(frac{MAX_{I}^{2}}{frac{1}{3 m n} sum_{R, G, B} sum_{i=0}^{m-1} sum_{j=0}^{n-1}left[I_{text {color }}(i, j)-K_{text {color }}(i, j)right]^{2}}right) end{aligned}
SSIM
结构相似性度量 (SSIM),更加接近人眼感知,常常与 PSNR 结合参考使用。 其包含三个分量:
begin{aligned} l(mathbf{x}, mathbf{y})=frac{2 mu_{x} mu_{y} C_{1}}{mu_{x}^{2} mu_{y}^{2} C_{1}} \ c(mathbf{x}, mathbf{y})=frac{2 sigma_{x} sigma_{y} C_{2}}{sigma_{x}^{2} sigma_{y}^{2} C_{2}} \ s(mathbf{x}, mathbf{y})=frac{sigma_{x y} C_{3}}{sigma_{x} sigma_{y} C_{3}} end{aligned}
其中,x、y 为需要对比的两张图像。最终 SSIM 是以上三个相乘:
begin{aligned} SSIM = l(mathbf{x}, mathbf{y}) times c(mathbf{x}, mathbf{y}) times s(mathbf{x}, mathbf{y}) end{aligned}
VMAF
Netflix 与几个大学实验室合作推出的多方法融合的客观评估指标,基于 Machine Learning。目前业内已经用的很多,算力消耗较大。
VMAF 的计算主要使⽤了3种指标,特征之间融合计算出总分的过程使⽤了训练好的 SVM (Support Vector Machine) 来预测:
- Visual Quality Fidelity (VIF):视觉信息保真度,为空域特征。
- Detail Loss Measure (DLM):细节损失指标,可以衡量内容可⻅性的细节丢失,针对⼀些特殊情况就不再适⽤,⽐如⿊框;⽐如过度的锐化也会导致计算结果与⼈眼不相符。
- Temporal Information (TI):相邻帧的运动向量,简单的使⽤亮度分量的平均绝对像素差来计算得到。
Example
以下是利用 FFmpeg 工具调用 libvmaf 库来计算 vmaf 的命令:
代码语言:javascript复制ffmpeg -i main.mpg -i ref.mkv -lavfi "[0:v]settb=AVTB,setpts=PTS-STARTPTS[main];[1:v]settb=AVTB,setpts=PTS-STARTPTS[ref];[main][ref]libvmaf=psnr=1:log_fmt=json" -f null -
ref
为参考 (reference) 视频,即 Ground-truthmain
为需要评价的视频- 需要注意的是
[main]
[ref]
顺序不能反过来
References
- ffmpeg Documentation http://underpop.online.fr/f/ffmpeg/ffmpeg-all.html.gz
- 峰值信噪比 - 维基百科,自由的百科全书 https://zh.wikipedia.org/zh/峰值信噪比
- 结构相似性 - 维基百科,自由的百科全书 https://zh.wikipedia.org/wiki/結構相似性
- 视频多方法评估融合 - 维基百科,自由的百科全书 https://zh.wikipedia.org/zh-cn/视频多方法评估融合
- 浅谈视频中的“清晰度”概念 - 知乎 https://zhuanlan.zhihu.com/p/476780601
- 视频/图像质量评价综述(一) - 知乎 https://zhuanlan.zhihu.com/p/54539091