从HEVC到通用视频编码的下一代视频压缩技术

本文来自于ATEME研究总监兼总监米克尔·劳莱特的主题演讲。他主要分享了MPEG-2、H.264、H.265、H.265、VVC，以及EVC、LCEVC等较新的编解码器。我们需要了解HEVC方面的编解码器授权，以及VVC标准化的过程。在探索的过程中，我们从Intra-coding和Inter-prediction方法等方面对图片分割进行了详细的介绍。在同样的背景下，我们通过VTM的复杂性、VVC的通用性以及它们在未来的编解码器之战中如何与VVC平衡。

文 / Mickaël Raulet

整理 / LiveVideoStack

所以，我将介绍从HEVC到VVC，以及今天到来的一些编解码器。

首先我先说一下ATEME。ATEME从事一家做广播的编码公司现在已经有20多年了，包括VideoLAN的一些人也在公司里面工作。所有的编解码器，我们一开始主要是从MPEG开始、VVC标准化，然后VVC竞争者，所有的编解码器都在一起攻克。其他的都是同时进行的，更重要的是我今天要讲的这个也是编解码器的未来进展。

我们同时是MPEG和ITU的成员，用我们所有的专业知识为它做贡献。但是我们的时间不多，我们主要是在实现编解码器。我们是AOM开放媒体联盟和MC-IF.org的成员，目的是减少我们为HEVC获得的模式问题。今天有一个大的社区论坛在讨论这个问题，同时我们也在VVC的标准化中活跃着。

与此同时，我们还有一个法国项目正在进行中，我们正在与VideoLabs即VideoLAN公司合作。我们会有VVC的全面交付，我们计划在今年的IBC上做一个演示。

在Ateme，我们主要实现的是绿色树时间线里的编码技术，从MPEG-2、H.264、H.265未来可能还有VVC。同时，有一个开源社区也是同步启动的，今天最知名的编解码器是VP9，而正在向开源编解码器靠拢的是来自AOM联盟，就是AV1。今天，他们正在讨论的是AV1的第二个版本，也就是AV2。

与VVC相同级别的还有另外两种编解码器EVC和LCEVC。LCEVC来自于日内瓦，而EVC则是由华为、高通、三星等一些公司的MPEG改编的。

MPEG格式化的思路是，与前者相比，要达到2倍的减少。每当我们得到一个特定编解码器的成功尝试，每隔10年就会有一次。2016年谷歌的演讲是说我们可以每隔18个月就能推出新的编解码器，而AV1和AV2并不是这样。它们的进展很慢但就MPEG而言，我们在2013年就有了一个，现在我们在2020年得到下一个版本。

目前，我们从HEVC比VVC提高了37%。他们声称主观上比HEVC有50%的改进。我们在复杂度方面比HEVC有6-10倍的复杂度，所以这也是我们在ATEME中要做的工作，因为我们要做的是实时性编码。

关于HEVC有一点，在HEVC标准化之后我们得到了很多专利池，这些专利池是在HEVC过程中出现的。之前只有一个单一的专利池主要是一些前标准公司拥有这个技术。后来到了MPEG LA出现了更多的HEVC专利池，这就给HEVC今天的部署增加了一些麻烦。

然后，我们再来看看HEVC的反应也是对AV1的反应。在MPEG组织他们希望编解码器的定义是自己的，他们希望从MPEG那里得到而不是从其他协会或联盟那里得到。我们从MPEG那里得到的反应是创建了MPEG-5的第1部分叫EssentialVideo Coding（EVC）;有两种版本文件一个是免版税的源自AVC的改进型，另一种是不免版税的但随着HEVC的改进它针对版税也更加友好。。

同时，我们有针对VVC的媒体编码行业论坛（MC-IF），目的是为了管理VVC内部的专利。大家可以看到VVC里面的专利会比HEVC多。同样这将是一个噩梦，但是VVC也有一个特殊性，你可以把里面有专利的工具去掉，可能会把你的技术中不想用的工具去掉。

只是给大家介绍一些关于VVC的情况，他们在2015年就开始了一个探索阶段。2017年的时候有一个联合征集方案，他们做了一个实验软件基于HEVC的基础上，他们做了一个实验软件比HEVC提高了34%性能提升。

后来他们认为可以在3年的时间内停止规范化进程。他们声称可以比HEVC有50%的进步。他们从一开始就想把目标锁定在HDR 和360°VR；标准化也将在2020年7月完成项目发布。

我们从这个幻灯片上看到了完整的过程。国际标准会在2020年7月发布，我们预计2021年或2022年有第一批硬件支持编解码。

VVC内部没有革命，这是一个非常高级的图表，我们对每个编解码器都使用了它。它使用帧内预测、帧间预测以及介于这两者之间的反馈。我们今天所拥有的是，我们在它们的每一个中都得到了越来越复杂的错误。基本上和以前的编解码器一样没有什么变革。

这里我们来看看HEVC和VVC的对比，左边是VVC，右边是HEVC。我们得到了更多的模式，更大的编码单元可达128x128。其中有不规则的形状，我们可以在下一张幻灯片上看到。另外，我们还有更多的DCT。

这是一张将AVC与HEVC和VVC进行比较的图片。我们可以看到你在VVC中有更大的块，还有一些我们在HEVC和AVC上不能有的矩形形式来带来改进。

从AVC开始我们只有9种模式。在HEVC中我们得到了35种模式的预测块，而在VVC中我们得到了67种模式！

今天在HEVC中，我们在以前的编解码器中没有的更多的东西是，我们有了一些六边形、三角形的形式，不再是矩形或四边形。这就是这个编解码器中真正新的部分。

以上是VVC对比HEVC的性能结果。你可以看到编码部分的复杂度高达8倍，我们记录的复杂度，在MPEG的目标是解码器不爆炸。另外，大家还可以看到VVC比HEVC的图表对比。

有趣的事情是我们在标准化过程开始时的复杂度。编码器的复杂度达到了2，现在我们的复杂度达到了9，但是我们的复杂度也从10%提高到了37%。我们看到解码器越来越停滞不前，我们正在为解码器本身找到更接近HEVC的东西。

VVC和HEVC之间的一个很大的区别是我们对HEVC做了几个修改，其实是对HEVC进行了扩展。因此，您有一些扩展配置文件，Scalable HEVC(SHVC)和Screen Content Coding Extension(SCC)。

VVC的第一个版本从一开始就会有这一点，基本上，你不会一个接一个地得到。到2020年7月你应该在一个编解码器中提供所有这些功能，这将加快编解码器的可用性。

现在我们还有另外3个编解码器要出来，其中一个已经完成了。

可以理解为那就是AV1。你可以看到一些大公司参与到这个标准化活动中来。我们的想法是要有一些互操作性和开放性的东西，是专门针对网络边界的OTT传输进行优化。

至少比VP9有20%的压缩收益，这是他们可以比拟的。存储没有增加，它使用了一些基于经典结构的工具，也使用了一些新的工具。更有趣的是，他们在解码器中使用了胶片颗粒合成，而HEVC则没有，它又回来了，为VVC。而且是的，他们可以扩展性和SCC。

HEVC和AV1比较，你有更大的编码块，这是他们比HEVC得到改进的地方。他们得到了更多的预测，他们有其他的方式来做时态预测。

我们比较了HEVC和AV1，因为它们没有使用我们在MPEG中使用的通用测试条件，所以很容易在MPEG编解码器之间进行比较，但是在Alliance和MPEG编解码器之间进行比较就变得越来越困难。

我们尝试将一些工具限制在AV1中，一般来说AV1的码率比HEVC更低。同时你可以看到曲线是交叉的，所以最终很难得到改善。我们看到HEVC有10%的改进，但谷歌最近声称几乎与VVC处于同一水平。

我们目前的实现比HEVC慢2到3倍，所以它并不比HM慢50倍。它现在更快了，但仍然不比HEVC快。

我要进入下一个MPEG-5第1部分，然后我将完成MPEG-5第2部分。

对于VVC，他们稍后开始活动，但MPEG的总体目标是与AV1和免版权费编解码器抗衡。这个想法是为了获得免版税的产品，并且对于Baseline配置文件来说确实非常快。我们可以为主要配置文件管理一些具有良好特许权使用费的产品，并且得到了三星，华为和高通公司的支持。

可以预期的时间表是，我们将在与VVC相同的日期之前获得国际标准的最终草案，基本上，一切都将在同一时间准备就绪。

绿框是基准配置文件，可能它们重用了MPEG-2组件以能够执行基准配置文件。一些工具也是免版税的，它们主要是对熵编码进行的。他们使用了HEVC的QT结构使之免版税。蓝色框是主要配置文件之一，大多数工具都与VVC兼容。这是在某一个特定的时间点上对VVC的提炼。

对于baseline profile，我们比H.264提升了40％。这点确实接近HEVC可以实现的目标。对于main profile我们的目标是比HEVC提高30％。您可以看到EVC baseline的编码器复杂度甚至比AVC还要快，而EVC则要慢4倍。

最新的是V-Nova的Perseus专有编解码器。他们来到MPEG提出他们的解决方案，baseline是典型的MPEG标准。他们可以使用AVC、HEVC或MPEG-2。然后，他们在技术之上添加了自己的技术，以提高视频质量。它将同时尝试完成，它将获得V-Nova的更多许可，因为它们是它的唯一贡献者。

最新的是V-Nova公司的Perseus专有编解码器。他们来到MPEG提出了他们的解决方案，其baseline是典型的MPEG标准。他们可以使用AVC、HEVC或者MPEG-2。然后他们会在基础上加入他们的技术来提高视频质量。它将在同一时间初步完成，它将有更多的授权给V-Nova因为他们是唯一的贡献者。

在底层，将运用到传统的编解码器。你可以添加一些其他层来改善这一点。LCEVC是上层，但基础层是标准编解码器。我们在此处看到的那样它们正在降低图像的分辨率，因此基础层确实很小，并且它们在基于子层编解码器的基础上增加了分辨率以及质量。

这就是组件所要求的，因此我们具有这些不重叠的漂亮曲线。与H.264相比，我们的技术之间有了很大的进步。我们使用他们的参考软件进行了相同的分析，我们也在ATEME产品上做出了贡献，说LCEVC与传统编解码器之间存在误解。

目前，我们团队正在努力改善常见的测试条件，以确保我们可以复制并实现每一处。我们在这方面做出了贡献，只是为了澄清他们的目标，以便能够复制他们声称拥有的决议。

在这里，我们几乎同时使用了3个编解码器。明年将发布。我们也许应该从所有这些硬件中获取一些硬件，至少我们知道三星将推动EVC。我们一定会努力推动VVC。

在2020年大家应该拥有第一个硬件，也是我们在2020年1月发布的第一个AV2代码库。我们期望在2026年（也许更早）发布一些AV2。

只是一个简短的摘要，我不会花太多时间在此上。我们将在幻灯片的末尾显示所有编解码器之间的差异。

作为演示文稿的摘要，我们有3个主要的编解码器同时相互对抗-VVC，EVC和AV1。我也没有提到对于AV1，我与Jean-Baptiste（VideoLAN）达成共识，我们在VideoLAN中获得了第一个软件实现，但与此同时，它们是今年将要推出的第一个硬件。

这样我们就能在IBC上演示哪种HD，HDR。大多数电视厂商将在2020年1月的CES上宣布他们将在其电视上支持AV1。我们还应该拥有到2020年支持AV1的电视。在2020年，我们将拥有两个编解码器，它们的硬件在2020年也可能会上市。

迄今为止，最好的仍然是VVC。EVC至少在专利问题上具有良好的权衡。我们为EVC基准提供了低端编解码器。这可能是AVC的成功，但AVC会在某个时候免费提供，是的，我们即将免费提供AV3。

有什么用吗？这就是问题所在。相反，我们的LCEVC似乎有不错的结果，但目前无法复制。我们希望对此特定编解码器进行澄清。在我们这方面，由于对VVC的需求更高，因此我们现在很可能会与VVC合作。

但是，如果需要，我们已经准备好过渡到EVC，并且我们已经有了AV1编解码器。

profile

0 人点赞