本次Video Insider采访的对象是来自动漫产业公司Crunchyroll/Ellation的视频工程师Chris Kennedy,主要谈的是关于HVS(Human Visual System,人类视觉系统)相关的视觉质量、视频压缩等话题。
Chris首先介绍了自己的履历,从一开始工作于ISP到后来进入广播领域,再到接触感知编码等。
Chris认为,利用人类的视觉认知特性进行视频编码压缩,实现视觉近乎无损的编码方式可以算作是一个“魔术”。
访谈首先谈到了视频的帧率问题,从最开始的十几帧低帧率到现在动辄120帧的帧率,人眼感觉到视频变的更加流畅。当然,人的主观感觉是因人而异的,一般做主观测试时,测的是人们对一段视频的平均主观质量。
而相对的,Chris说道,客观质量评价,例如传统的psnr、ssim等都有很多缺陷,所以会导致使用它们指导编码时可能得不到很好的效果。
随后访谈谈到了现在人们已经逐渐习惯了高分辨率、高质量视频,无论是在电视上还是在手机上,对视频质量的要求在不断提升,传统的客观指标已经不堪重负。不过他们正在努力结合收集到的用户数据用于VMAF模型训练,目标是训练出一个通用的、高可信的模型。
接下去的一个问题是关于动画编码的,动画编码与真实世界图像的编码有很大不同,一般认为动画的纹理比较简单,但是有些特殊情况也会对编码器提出很高的要求,所以有时需要专门针对动画编码的相关编码器进行特殊配置。
随后,Chris介绍了他们自己正在开发的基于x264等编码器的播放器,在编码方面,引入了感知方面的码率分配机制等。
最后,他们也谈到了关于内容自适应编码和自适应码率方面的一些问题。