在刚刚过去的2021腾讯数字生态大会上,腾讯云音视频联合艾瑞咨询共同发布《全真互联趋势报告(2021-2022)》(下文简称趋势报告,完整版报告下载链接见文末),并邀请艾瑞CEO邹蕾女士在音视频专场就报告进行了现场解读。下文将依照《趋势报告》从音视频产业的变革出发,探讨音视频与各行业、场景融合的价值,与各位一同展望音视频在全真互联时代的技术趋势与想象空间。
艾瑞咨询合伙人&CEO邹蕾
《趋势报告》指出,当前,在技术发展以及疫情影响的催化下,音视频已经发展演进成一种基本能力,为企业从视频生产到处理、传输以及最终消费的全流程进行全方位的支撑。无论是直播电商、在线教育、办公协同还是内容生产,实时交互的音视频能力正在赋能越来越多的行业及场景,创造出巨大的价值。未来,音视频作为全真互联时代的重要基础设施,将进一步向超高清、低延时、沉浸式、强交互的方向发展,推动物理世界的数字化程度进一步加深,并通过融入到各行业、各场景,重新定义未来应用,在全真互联时代发挥巨大作用。
《趋势报告》首先分析了当前音视频的发展背景,指出当前音视频正加速走向在线、实时,以音视频为代表的富媒体信息已然成为人们交流沟通的主流方式。同时,短视频的强势崛起,让视频的消费模式愈发趋于短、频、快。
反映到音视频基础能力上,一方面,视频画质不断提升,主流视频网站的分辨率提升至1080P、4K甚至是8K,帧率在以往24/30FPS的基础上增加了60FPS的选择,为用户提供更为极致的视听体验。另一方面,实时音视频在整个音视频产业中的位置正变得越来越重要。直播连麦、视频会议、在线教育这些互动频繁、甚至需要多人实时交流的场景,都需要采用实时音视频技术将时延从秒级缩小至毫秒级。各大音视频云厂商针对在线、实时的需求,均推出了相应产品。
同时,《趋势报告》指出,随着音视频成为各行业的一项重要基础能力,它需要被独立出来,变得容易被集成、容易被调用、容易被计量。行业对于音视频通信能力的需求也在向着更低廉的成本、更弹性的扩容、更敏捷的试错、更快速的生产演进,音视频上云的重要性日益凸显。
音视频云因此也由最早期的聚焦CDN加速到以PaaS服务助力视频应用快速开发,进一步延伸服务链条,对视频从生产到处理、传输以及最终消费的全流程进行全方位支撑。不仅大幅降低了音视频应用的开发准入门槛,更通过促进产业效率提升不断推动音视频产业的繁荣。
我们还能够看到,为灵活满足不同场景的个性化需求,低代码开发正在逐步普及。音视频云厂商纷纷搭建aPaaS、低代码平台,让音视频的开发更加便捷高效。同时,低代码的开放模式也方便了音视频云厂商和其他场景化解决方案商的结合,从而能够向企业提供面向全场景的音视频一站式解决方案。
随着技术的发展,音视频已然成为一项基础能力,渗透到各行各业,为社会生活的各个场景赋能,创造更多的价值。就像云计算不该看作一个单独的行业一样,我们看待音视频也同样不应该再将其作为一个单独的行业。《趋势报告》具体分析了直播电商、视频会议、内容生产、实时云渲染及远程实时控制五大赋能场景,展现音视频能力对各行业的影响及带来的价值。
赋能场景一:直播电商常态化,低信息差重塑供应链
直播作为营销方式与销售渠道,在电商行业的应用日益常态化。通过直播电商跳过中间商,直连工厂与消费者,大幅缩减了用户信息的反馈时间,一个单品的直播结果迅速反馈到生产端。不仅间接加速了行业的优胜劣汰,更促进了C2M的定制化生产。直播期间数据集中爆发,极大缩短了数据收集和分析的周期,数据的可用性和结论性更强,品牌商可以更迅速、准确并且真实地获得前端的消费者洞察,从而灵活控制研发设计与产销情况的匹配。
赋能场景二:视频会议流量激增,迎来跳跃式发展
视频会议对于协同办公的价值因为突发的疫情事件而实现跃进。
- 疫情突发期,政企单位开启居家办公模式,企业内部协同需求高涨,原本不用视频会议的企业和用户“被迫使用”相关产品,短期内形成流量暴增现象;
- 疫情消退期,由突发期带来的非刚需流量褪去,留存用户因对视频会议专业性、安全性的容忍度降低,将大范围转用专业的视频会议系统,推动硬件设备与云产品升级;
- 后疫情发展期,远程办公概念普及,疫情教育用户作用明显,整个产业链,从硬件商、解决方案商到渠道商等开始思变,他们将通过细化行业需求,提供专业服务推动整个价值链抬升。
赋能场景三:策采编发全流程线上协同,助力高效内容生产
从内容产业的层面看,策、采、编、发的全流程线上协同将会是未来趋势。尤其对于传统媒体,移动互联网冲击之下,过去成熟且模式化的策、采、编、发流程,严谨有余但效率不足,为适应新媒介的消费习惯,必须向更加高效智能的生产模式发展。音视频云不仅可以提供分布式的内容分发网络,通过超清转码、窄带高清、画质重生等技术满足传媒行业高质量视频更低时延、更低成本的传播需求,更能够以云端的一体化生产平台,让摄像、审片、剪辑、导播、运营等各环节的人员实时线上协作,促进内容生产效率的提升。
赋能场景四:实时云渲染从游戏行业出发,延伸至全行业通用能力
随着云渲染行业的不断成熟,其所应用的场景也从云游戏开始更多的向产业领域拓展。如在文旅场景,企业可以利用云渲染技术将现实场景完美复原,用户打开小程序就能享受沉浸式体验。本次生态大会的云展厅就基于腾讯云音视频的实时云渲染能力打造,让用户能够利用微信小程序,便捷地线上沉浸式逛展。不仅文旅场景,工业仿真、智慧园区、智慧城市等众多领域都有云渲染的应用价值。
赋能场景五:5G 边缘云让远程实时控制成为可能
在车联网、智慧港口、智能制造等存在远程控制需求的场景中,实时音视频同样发挥着极其重要的重要。基于5G网络和云边协同,将复杂的数据处理、分析和控制策略交由中心云,将实时性要求高的计算和服务交给边缘云,将能实现在毫秒级时延下的远程控制。
《趋势报告》还指出,随着云服务与产业互联网的结合不断加深,音视频云正不断向更广泛的场景渗透。场景化解决方案变得越来越重要,成为主流的音视频云厂商实现差异化竞争的主要手段。PaaS厂商聚焦能力,SaaS厂商深耕场景,因此PaaS与SaaS厂商之间的合作愈发频繁。
纵观互联网发展的历史进程,消费互联网打开了物理世界数字化的窗口。流量红利消失加上传统行业数字化转型的深入,让互联网行业的概念扩展到了产业互联网。而在5G技术的加持下,音视频尤其是实时音视频的应用将使得物理世界的数字化程度会进一步加深,推动互联网走向“全真”的新时代。
在迈向“全真互联”的关键节点上,《趋势报告》最后详细解读了音视频这一全真互联时代重要的基础设施,在未来的几大发展趋势。
发展趋势一:音视频互动创造沉浸式、实时社交体验
相比于图文、传统的直播、点播,实时音视频为用户带来了沉浸式的社交体验。当端到端的音视频传输延时下降到100ms以内的时候,K歌、狼人杀这样的面对面场景就可以搬到线上。超低时延拉进了人与人之间的距离,成为互联网应用提升用户粘性的杀手锏。也正因此,音视频互动类应用正在全球范围内流行。
发展趋势二:技术驱动,VR/AR硬件与内容协同发展
对于发展尚不成熟的VR/AR产业来说,硬件承载内容、内容支撑硬件的相互关系是产业链无法实现协同发展的根本原因。参考PC、智能手机、IMAX的发展路径,内容的升级依托于硬件的迭代,两者叠加带来用户体验的飞跃才能促进产业整体形成良性循环。而5G和云计算分别解决了VR/AR的传输能力问题和计算能力问题,将推动头显设备的无线化、移动化,降低用户的使用门槛。加之交互、沉浸式技术的升级迭代,VR/AR产业将有望以更低的生产成本创造更加丰富的内容体验,破解当前的商业化难题。
发展趋势三:迈向社交终极形态,全球掀起构建超级数字场景的浪潮
从VRChat到Rec Room,VR在社交终极形态上的探索一直在持续。作为超级数字场景的实现基础,VR被视为是打造真正虚拟世界的钥匙。Facebook已经打造了Facebook Horizon VR社交平台,以及主打虚拟赛事观看的Venues、虚拟家庭影院Oculus TV、虚拟游戏中心Rooms等众多VR应用。
发展趋势四:全球音视频云为全真互联应用保驾护航
在全球全真互联的浪潮之下,建立全球化的音视频云尤为重要。面对更加复杂的海外网络环境,如何保证高质量的跨境传输是一大难题。目前,行业内领先的音视频云厂商在海外都拥有相当数量的服务节点,并基于同当地运营商之间的合作关系设有跨境专线,能够实现灵活的视频流调度,从而为海内外用户提供同等的播放体验。对于互联网应用来说,引入音视频云厂商可以充分发挥规模效应的优势,缓解自己搭建基础网络环境的成本、技术难题,而音视频云厂商在跨境运营方面积累的经验,同样有助于互联网应用应对海外不确定环境带来的挑战。
发展趋势五:面向全真互联时代,构建线上线下一体、虚实结合的技术体系
面向全真互联时代,企业需要构建线上线下一体、虚实结合的技术体系。低时延、超高清、沉浸式和强交互是其中的重点。
发展趋势六:基础网络“三合一”,下一代编解码为超高清插上丝滑翅膀
考虑到音视频应用对CDN(用于直播、点播传输)、RTC(用于实时音视频传输)、IM(用于图文等即时通讯消息传输)三张网络的并行需求,主流音视频云厂商开始在基础网络层面将三张网络融合,通过复用三张网络的“云、边、端”基础设施,实现海量调度、就近接入、传输优化,适配不同应用场景对基础网络的需求,降低音视频产品接入门槛。
目前,音视频领域的下一代编解码标准已经全面商用。以H.266为例,相比起H.265,它能够在不影响画质的情况下将视频码率降低到原来的一半,这也让它非常适合用来传输4K甚至8K的超高清视频,节约大量的带宽成本。
发展趋势七:对沉浸感、交互体验的追求要求技术不断升级
沉浸式技术致力于将现实和虚拟混合,一个完全沉浸式、感知真实的环境将由多个组件组成。虽然当前市面上的VR设备以3Dof为主,但6Dof才真正能够体现VR的魅力。6Dof是指物体除了具备在X、Y、Z 三轴上旋转的能力之外,也具备在X、Y、Z三轴上移动的能力。人体的运动可以大致分为旋转和位移两大类,因此6Dof的VR设备几乎可以模拟所有的头部动态。
在此基础上,加入对头部歪头、缩脖子、半身前倾等微动作的识别,并利用手柄实现抓取、射击、打斗等动作,将可以实现1 1>2的效果,对真实世界的模拟几乎可以以假乱真。
发展趋势八:音视频重新定义应用,全真互联想象空间巨大
随着音视频技术的发展演进,音视频云将能为企业带来超高清、实时、沉浸式的互动体验,并在通过融入到各行业、各场景,重新定义未来应用,在全真互联时代发挥巨大的价值。
扫描图中二维码或点击文末「阅读原文」
下载完整版《全真互联趋势报告(2021-2022)》
腾讯云音视频在音视频领域已有超过21年的技术积累,持续支持国内90%的音视频客户实现云上创新,独家具备 RT-ONE™ 全球网络,在此基础上,构建了业界最完整的 PaaS 产品家族,并通过腾讯云视立方 RT-Cube™ 提供All in One 的终端SDK,助力客户一键获取众多腾讯云音视频能力。腾讯云音视频为全真互联时代,提供坚实的数字化助力。