”
8月5日-6日,LiveVideoStackCon 2022 音视频技术大会 上海站,和你一同开启通向未来的大门。
视频编解码性能优化与实现
视频编解码技术不断迭代的背后,是来自人们对交互体验提出更高清、更沉浸、更低延时的更高要求。为了满足人们对视频的需求,各大厂家对H.266、AV1等标准的编码器进行不断的研发与优化落地;除此之外,由于不同的视频内容以及不同的带宽特点,视频编码技术工作者们在针对特殊场景的编码优化中也在不断深耕。人、视频、编码标准,在这个需求闭环中,视频编解码技术无疑是串联整个闭环中的重要角色,到底视频编解码的性能有哪些优化?又有哪些实际的落地应用?将是本专题重点关注的内容。
讲师与议题
随着Shopee电商业务在东南亚等市场迅速展开,视频和电商结合的应用迅速落地。比如feeds流、买/卖家秀、直播带货、数字银行开户以及短视频等。东南亚大部分地区手机用户使用的是国内2010年左右普及的千元机机型,这些手机在视频编解码、图像处理方面存在严重的性能瓶颈。并且,当地网络基础设施建设不太完善,在这样的网络条件下传输媒体数据谈何容易。另外,海量的视频文件和直播视频处理给Shopee后台带来了巨大的压力。那么Shopee是如何通过技术手段来解决这一系列问题的呢?
本次分享将从3个方面为大家解开谜团。第一,高清低码。Shopee采用自研的极速高清转码,通过编码器优化与图像处理技术,在码率降低40%的情况下,尽量保持画质,该平台服务于Shopee的短视频、直播带货、feeds、rating流等业务。第二,自研SVC编码器,结合时域SVC和空域SVC,让实时视频流更容易适应各种网络情况。该编码器集成在Shopee连麦带货SDK、数字银行开户SDK中。第三,性能上的优化。一入多出编码,端上快速算法,SIMD指令集优化,服务于点播多清晰度转码平台,端上编码SDK等。
虚拟现实、增强现实等新型产业的高速发展催生了全景视频、光场图像、动态点云等高维视觉数据。高维视觉数据可通过投影等方式产生视频,并使用视频编码技术进行压缩。但是高维视觉数据投影产生的视频呈现出与自然视频截然不同的特点,例如,全景视频存在明显几何形变和空间不连续等,使得现有面向自然视频的视频编码技术不再高效。本演讲拟介绍一系列面向高维视觉数据的视频编码技术,可显著提升高维视觉数据压缩效率,为虚拟现实、增强现实等产业的发展奠定坚实基础。
随着AI和多媒体技术的发展,智能安防、智慧城市、自动驾驶、工业互联网等场景对机器智能后端任务性能更加关注,编码方式与面向人眼的视觉编码会有很大不同。2020年1月,全国信标委多媒体分委会成立了面向机器智能的数据编码DCM标准组。
本次分享通过可使用授权数据集、应用场景编码需求、隐私保护需求、国标立项草案、探索实验、技术方案、参考测试平台、知识产权政策、对外联络等方面介绍DCM标准、技术的最新进展和应用探索。
快手平台内视频类型种类繁多,且视频源的画面质量存在较大差异。“如何能够针对多种类型且较大质量差异视频,让用户消费到更清晰、更流畅的观看体验?”面对这一问题,快手音视频技术团队深入研究智能音视频修复及增强处理等相关技术,打造出“质臻影音”,为广大用户提供沉浸式观影体验。
本次分享将分为三个部分,第一部分介绍快手平台多种视频类型及显著质量差异,以及快手如何自动化识别检测;第二部分介绍快手的智能音视频算法如何来有效修复和增强不同类型的视频,具体包括多次转码压缩损伤和老片划痕胶片噪声等修复算法,和智能超分辨率,HDR高动态范围生成,高帧率插帧生成,以及3D环绕声场等增强算法。第三部分将介绍快手质臻影音相关智能修复及增强技术的成功落地方案及效果。
扫描图中二维码或点击阅读原文
了解大会更多信息
喜欢我们的内容就点个“在看”吧!