张光:鸿沟已成坦途

2019-07-01 16:35:47 浏览数 (1)

作为一名在音视频领域摸爬滚打多年的老兵,见证了行业的不断发展与变化,其中感触最深的是随着基础的不断改善,很多以前不可逾越的鸿沟都已经变成了坦途,张光说到。LiveVideoStack采访了三体云技术副总裁张光,畅谈了音视频技术的发展变化与挑战。

文 / 张光

策划 / LiveVideoStack

LiveVideoStack:张光你好,能否向LiveVideoStack的读者介绍下您自己,以及目前主要的工作和关注的技术方向?

张光:大家好,我是张光,来自北京三体云,一名在音视频领域摸爬滚打十多年的老兵。目前主要负责三体云实时音视频服务的开发。对与实时音视频相关的技术和领域如AR、VR等高度关注,同时也非常看好AI在实时音视频领域的落地。

LiveVideoStack:在音视频领域从事研究与开发工作10余年,能否从您的角度为大家分享一下音视频技术的发展与演进?

张光:在音视频领域内从事这么多年工作,也见证了行业的不断发展与变化。其中让我感触最深的就是随着基础的不断改善,很多以前不可逾越的鸿沟都已经变成了坦途。

当年刚刚从桌面系统开始向移动端发力的时候,智能手机的软硬件系统还处于非常初级的阶段,无论是手机的性能还是系统API提供的能力都不足以支撑实时音视频通讯的需求,root、私有接口以及其他“非常规”的做法都在这个时期使用过。同时3g网络也无法支撑较高质量的音视频,网络的不稳定又使得即便是较低质量的音视频在手机上的体验也非常糟糕。因此在当时移动端的实时音视频通讯能力仅仅只是作为桌面端的一个附庸,是销售在面对客户争抢订单时的一个加分点而已,实际使用者寥寥无几。

随着智能手机软硬件的提升,4g网络的全面铺开,同时感谢WebRTC的开源,移动端上的实时音视频的开发变得更加简单,实用性变得比以往任何时候都好。到现在每天看到有如此之多的移动端用户在三体云上进行实时音视频的交互,这让我们感到无比的自豪和欣慰。

另外一点让我感受很深的是市场变得更加成熟。早期在做传统视频会议的时候,也曾为用户提供过SaaS的服务,后来被迫中止。产品力是一个方面,另一方面市场对公有云服务的接纳程度一般,用户宁愿买下一套软件自己部署和维护。

LiveVideoStack:三体云的业务涉及泛娱乐,在线教育,视频客服等多种场景及行业领域,能否简单介绍在实现这些业务场景的过程中存在哪些挑战?

张光:单就在线教育而言,最初我们介入这个行业领域的时候,想的非常简单,认为它就是实时音视频技术的外延,无非就是增加了白板、课件等功能而已,我们只要简单的加上这些功能自然就会有客户买单。但当我们真正面对客户的时候才发现当时的想法太过天真。闭门造车无法真正的直击用户的痛点,没有深入到行业内驱,不了解用户的真实需求,是无法提供让用户满意的产品的。我们已经和仍在继续做的事情就是真正的深入到行业内部,从用户处获取最真实的需求,并且提供超越用户预期的产品。

LiveVideoStack:PC端,移动端多媒体技术的发展,可以说很大程度上改变了人们的娱乐方式,三体云针对泛娱乐场景又有怎样的创新和规划?

张光:泛娱乐的应用场景有很多,目前比较主流的玩法有:直播连麦,音频电台,纯音频的多人交友以及带视频的多人交友、主播PK(市面上的玩法基本是主播1对1之间的PK,各自主播的观众所观看的内容有区别)。目前三体云可以支持多主播跨房间进行PK,并且可以实现与主播直推CDN的无缝切换;在线KTV的玩法也是我们目前所支持的,并同时提供歌词字幕同步的功能。而合唱的玩法由于延迟的问题目前还无法完美实现,但我们正在尝试在5g下将延迟降低至30ms以内,以达到比较完美的合唱体验;此外三体云还支持变声、美颜等泛娱乐场景几乎必备的功能。同时我们也正在积极探索AR、VR等技术在未来的娱乐场景中的实际应用。

LiveVideoStack:我们可以看到用户对于清晰度、流畅度、实时性的追求从未终止,三体云在针对用户体验质量方面做了哪些工作?

张光:最初的时候我们经常只能通过用户的反馈来发现一些问题,然后进行改进,这样的方式不但效率低下,而且发现问题过于滞后。 为此我们建立了一套实时的质量监控体系,可以让我们在用户出现状况的同时、甚至早于状况发生就发现问题。除了对个例的分析改进,我们还通过对质量监控体系关键指标的不断优化,来提升整体的用户体验。

LiveVideoStack:5G的到来拓宽了多媒体发展的道路,在您认为5G将会为实时视频通讯技术带来哪些机遇与挑战?

张光:就像前面提到的4G为当前的移动互联网的实时音视频奠定基础一样,5G时代的到来必将带来更大的改变。

最直接可以看到的改变就是目前某些对延迟要求非常高的一些应用场景将变得更加实用。比如我们目前所熟悉的移动端K歌场景,基本无法做到两人同时合唱,各家的实现均是通过放弃掉一定的互动性来完成,相信5G时代的到来,更低的延迟将会使得这个问题迎刃而解。

尽管在4G的网络下用户在绝大部分时间都可以获得良好的实时音视频体验,但在弱网环境下依然可能带来流畅度和画质的降低。而5G蜂窝数据传输速度的巨幅提升,将使得我们可以为用户提供更稳定更高质量的音视频服务。

AR/VR一直是个人比较看好的应用,4G下尽管已经有了一些实现,但目前看来用户体验都不是特别满意,相信在5G时代会有质的飞跃。

LiveVideoStack:能否为大家简单剧透下您在LiveVideoStackCon 2019北京上的分享内容?

张光:三体云作为一家实时音视频服务提供商,致力在任何情况下为用户提供高可用的实时音视频服务。本次我将从容灾、报警机制、智能调度、质量监控等方面讲解三体云如何为用户提供高可用的服务。

LiveVideoStack 招募

LiveVideoStack正在招募编辑/记者/运营,与全球顶尖多媒及技术专家和LiveVideoStack年轻的伙伴一起,推动多媒体技术生态发展。了解岗位信息请在BOSS直聘上搜索“LiveVideoStack”,或通过微信“Tony_Bao_”与主编包研交流。

0 人点赞