The Economist (经济学人)在 The World in 2021 特别刊的编者序中写到:“21 是一个与好运、冒险、机遇和掷骰子有关的数字 —— 它是一个标准骰子六面数字相加的总和(即前6个自然数——1 2 3 4 5 6 = 21——的和,也称三角形数)”。
维基百科又告诉我们,21 是库德族旗帜中太阳光线的数量;是化学元素钪的原子序数;是斐波那契数列的最小非平凡数;是用于 FTP 连接的标准 TCP/IP 端口号。
此外,21 克还被认为是灵魂的重量。
所有这一切都离奇地应和着这个不同寻常的年份 —— 2021,它带着巨大的不确定性由远及近—— 风险没有变小,但吹来了新的风口,带来了新的需求 —— 需求刺激着市场,出现了新的商机 —— 而技术本身,也由此开始加速迭代。
以下是 LiveVideoStack 最为关注的2021年(不完全)音视频技术趋势,也是LiveVideoStackCon 2021 上海站 —— 新技术,新机会 —— 聚焦的技术热点。
关于边缘计算,大部分人都不会否认它代表的未来,不仅因为集中式架构面临巨大的网络成本,也因为用户对时延愈发苛刻的需求。但要实现边缘与中心协调的架构,需要时间和平台方更多的投入 —— 就像AWS等云厂商在云计算初期面临的挑战一样。
5G等基础设施的建设将为边缘计算打下关键的基础;关键应用场景和杀手级应用也将真正成为驱动边缘计算发展的一股力量:如工业领域对网络时延的需求,云游戏对海量边缘计算节点的需求,超高清或VR视频对超高带宽的需求等等。
本次 LiveVideoStackCon 2021 上海站,将有更多边缘计算相关的当下业务场景及其未来应用实例的技术分享。
实时音视频通讯、云游戏、超高清视频、VR/AR等应用与场景的落地和商业化,都离不开端到端低延时的支持。而想要实现超低延时,不仅体现在终端设备的迭代升级、硬件加速以及底层Codec的不断优化,网络架构的升级、传输协议的优化、链路策略的选择等等都是至关重要的因素。
5G、8K 时代的到来(或即将到来),不仅带来了传输带宽、终端运算能力的提升,VR/AR、沉浸式、高自由度视频技术等也得以快速发展。从高帧率到高分辨率,再到如今的 HDR,我们不断追求最极致的画质,这又进一步带来了全新的真实现场感和交互式体验。目前来看,AR/VR 在许多教育、培训场景下已经得到验证,并且正在向泛娱乐领域过渡,也许在未来 1-2 年内,VR 效果的短视频观看体验就会得到普及。
如今,似乎每一个软件投资和产品公关都要提及“无代码”平台或功能。与云计算类似,无代码本身也不是一个固有类别,而是用户与软件工具交互方式的转变。就像PC普及了软件的使用、API 普及了软件连接、云普及了软件的购买和部署一样,无代码或许能够通过普及特定的技术技能来引领下一波企业创新。
快手与声网等互联网公司也都成立了专门的团队进行“无代码/低代码”项目的研发。
“低代码(Low Code)”和“无代码(No Code)”经常被互换地提到,但它们的概念却截然不同。低代码和无代码都抽象了底层代码及其技术性,低代码旨在通过有限的抽象提高开发人员的效率,而无代码则想通过更强大的抽象来增强开发人员和非技术人员的能力。
根据Forrester Research, 截至2020年,84%的企业已经开始使用低代码/无代码技术,Gartner预测,到2024年,低代码/无代码将占到所有应用程序开发的65%。
一直以来,与音频相关的技术(无论硬件软件)分享都较为小众,但人耳对声音品质的追求却越来越高:无论是RTC场景下的 AI 降噪、回音消除,还是针对 TWS 耳机的数字信号处理以及更加未来向的音频 VR 技术,都在越来越多地受到关注与重视。目前为止,针对 RTC 场景的音频算法与传输,还没有一个通用的解决方案与评测标准,但与此同时,我们也看到了各家在音频技术上越来越多的投入。
在本次上海站的“音频新体验”专场,我们首次将音频专题扩展为全天 7 个场次,分为硬件与软件两个半天的场次,内容涉及云视频会议的音频体验、基于深度学习的噪声控制、手机播放端及硬件系统的音频算法、支持多平台多语言的自动口型生成项目,以及后续(春节后)将会陆续确定的更多讲师与分享议题(敬请期待)。
随着视频内容需求的飞速增长,其在网络上的传输量也越来越大——动辄几十、上百兆的码率,这对视频编解码算力提出了更高的要求。对比 GPU、FPGA、ASIC 等硬件方案,从延时控制及能耗等方面观察,ASIC 加速看上去是更好的选择,但定制化特性又使得它的前期投入不容小觑。因此,GPU 和FPGA 在特定场景下依旧保持着不可或缺的优势与地位。
伴随多媒体技术的日新月异,内容形式与需求也在不断变化与增长,抖音、快手、B站等视频平台的崛起,极大满足了人们的精神需求,然而内容生产往往受限于创作者的精力与想象力,难以高频度持续供给优质内容。从Google的 url2video 到百度的VidPress,从NLP、TTS到网易AI生成歌曲《醒来》,多媒体技术革新正将自动化智能生产推向人们的日常生活,并提供了更多元、更有趣的音频与视频内容。与此同时,未来多媒体消费的不断升级,也将推动自动化生产工具迎来更加快速的发展周期与更优质的内容体验。
低时延流式数据处理框架、嵌入式软件媒体处理框架、OWT、FFmpeg、Gstreamer、SRS、WebRTC、VVC、AV1......
No need to say more.
最后借用微帧科技的联合创始人&CEO 朱政老师为 LiveVideoStackCon 2021 上海站 “技术商业策略” 圆桌所写的专题描述做结尾:
“疫情的风暴席卷全球,改变着人们的生产和生活方式。许多公司在艰难中寻求发展,也有许多公司在蓬勃中站上浪尖。视频的大时代在加速到来,多媒体新技术、新产品、新应用不断迸发。浪淘风簸,如何在激烈的挑战中寻找机会?吹尽狂沙,如何将技术转换为商业价值?”
2021, LiveVideoStack 希望陪你一同不断前行,寻找答案。