『侧面』:走近LiveVideoStack Meet北京讲师

2021-09-02 15:15:25 浏览数 (1)

4月22日,第一次『LiveVideoStack Meet北京:后直播时代技术』将在将在洪泰创新空间·Azure(地铁14/15号线望京站 H口)举行。(点击阅读原文,进入报名页面。

在紧张筹备内容之余,Ant与6位专家进行了访谈,畅谈了自己的成长经历、音视频技术的未来与应用前景,全文如下。

受访嘉宾

  • 唐赓 北京密境和风科技有限公司iOS技术负责人
  • 张玺辉 布卡互动创始人
  • 唐通 CC视频研发副总监
  • 张弩 百家云架构师
  • 刘文 微博算法工程师
  • 郝明非 金山云视频技术总监

Ant:请简单介绍下自己的工作经历,以及现在主要从事的工作内容。

唐赓:我的经历比较杂,1997年左右就开始在BBS论坛里玩Linux/FreeBSD,2000年开始从Windows开发工程师入行,从事音视频软件、安全软件的研发。之后很长一段时间都在从事安全相关的行业,对Linux、FreeBSD、Windows等OS内核进行过比较深入的研究和开发,后来在一家多媒体工具公司做了几年CTO,再后来自己创业又回到安全领域,做企业级移动安全产品开发。最后就进入数字公司,机缘巧合,期间花椒iOS团队严重缺人,于是我在花椒第一版上线后两个月带着团队加入花椒。

张弩:我毕业于西安电子科技大学,2006年加入北京威速科技有限公司,从事企业级软件视频会议系统开发工作。2014年开始供职于百家云,主要负责直播产品的设计研发,涉及分布式服务器架构、大数据传输、音视频编解码技术、多平台客户端支持等工作。

张玺辉:2010年我在清华研究生毕业以后,就开始进入音视频直播互动领域创业,并一直将公司的创业方向定位于教育领域。希望通过“布卡”的“不卡顿、不掉线、不延迟”的服务,去实现“让知识没有距离”。

刘文:先前服务于方正,主要从事图像处理与识别方面的研发,先后完成印刷行业图像编辑工具、文本票据识别等工作。2014年来到了微博,从事图像与视频算法研发。

唐通:曾就职于任子行网络技术股份有限公司,任研发工程师,从事互联网安全方向工作。目前就职CC视频,任研发副总监,负责公司的云直播Saa平台的研发及管理工作,对视频直播领域,大型分布式系统有较深入研究。

郝明非:2010年底加入百度,先后从事客户端、服务端、智能设备开发,亲历媒体云从无到有,支撑百度网盘、百度视频、百度文库、贴吧等内部业务和外部开发者的多媒体业务。目前在金山云视频云部门,负责视频云研发工作,包括直播CDN,视频处理,SDK和产品化。

Ant:(to唐赓)您以前搞云计算、大数据存储,从服务端转型做iOS的动力和原因?

唐赓:做云架构、云计算、大数据存储主要是为了我们的企业级移动安全产品服务。花椒当时缺iOS工程师,其实移动端界面开发并不是我强项,我主要做一些基础技术的研发,我当时带的团队还有一些iOS工程师,就一起带过来了,而且我觉得直播领域应该可以实现我一些多媒体方向的想法,就积极参与进来了。

Ant:(to唐赓)iOS开发有啥魔力,能让他通宵达旦地工作? 现在经常干活到凌晨3点以后,线报说您前两天又干到了凌晨5点。

唐赓:其实还是因为给老板承诺的发布时间太紧,功能太多,白天经常被各种事务牵绊,一会儿需要开会一会儿需要去协调,另外白天人太多网络还不好用,晚上相对来说效率要高很多。

Ant:(to刘文)机器视觉算法和音视频算法的发展现状是怎样的?已经有哪些应用场景。

刘文:随着分布计算、GPU并行运算的普及和深度神经网络的快速发展和走向应用,以往的机器视觉领域的效果得到很大的改善,例如在语音识别、人脸识别领域的识别率甚至可以达到或超过人类的识别能力。在音视频领域,AI视频内容分析与识别已经在推荐等领域得到了很好的应用,AI视频智能编码能够在保证质量的前提下节省带宽成本。智能技术与业务的结合将是趋势。

Ant:对音视频行业的未来怎么看?看好哪些技术?

唐赓:我觉得现在是一个非常激动人心的时代,技术上以前不行的现在可行了,产品上以前不敢想的现在敢想了,所以很多想法都有机会去尝试和实现。

张弩:在企业市场,传统的软件视频会议、监控产品发展了十几年,已经非常成熟,有非常多优秀的企业。随着这几年互联网的基础建设加速发展,大带宽和智能移动终端在个人消费市场逐渐普及,使得互联网各类产品中音视频的应用越来越多,比如秀场类、财经类、游戏类、网购类直播、在线教学等等。这些实践基本都是C端的应用,随着这些应用的成熟,应该会促使企业市场也互联网化。未来音视频服务的SaaS或是PaaS化应该是个趋势。 技术方面,音视频编码会继续发展。H.265对整个视觉体验的提升效果很明显,商业级别的编解码器会越来越成熟。一些能适应各种声音场景下的音频编码也有不错的前景,比如Opus,既能适应实时语音,又能适应音乐场景,在互动类型的应用(比如在线教育)上有很多优势。

唐通:就聊直播吧,未来直播领域肯定会朝着更低的延迟,更优质的互动这个方向发展。传统一人讲,多人听的广播模型将会融入多人实时互动的视频通话模型,在此基础上,即保证了广播模型的高承载能力,又实现了视频通话模型的低延迟互动。因此,我看好的技术有WebRTC,用于实现整套视频通话的框架,还有流媒体MCU(LiveVideoStack注:Multipoint Control Unit,是视频会议系统的核心部分),用于结合视频通话模型与广播模型。

郝明非:音视频作为最直观的观感来连接人与信息,人与人,人与场景,人与经验,加速信息的生产和消费。音视频会成为各类应用的标配,作为优良内容的载体和沟通交流的通道都会发挥巨大作用。技术依托场景存在,比较清晰的一个场景是用户对高画质的追求是持续的,看好能带来画质提升的技术,包括编码、传输、客户端画质增强等方向。

Ant:都说自己技术牛,到底各自技术和产品哪里牛?有何过人之处?

刘文:微博视频的重要产品包括视频流、视频推荐流等,都是采用自动播放的形式,这些都很大程度提高了用户对视频的消费。此外,围绕着视频观看,为了提供更快的视频展示,在播放端缓存策略、内核等方面做了优化,有效提升了视频的加载速度。为了提供更清晰的视频内容同时尽量保证带宽成本的节约,对已有的H.264编码策略做了优化,对H.265、VP9等也作了尝试。

张玺辉:带宽一直制约着直播质量,布卡可以做到1M带宽保证直播的流畅程度,下一步将把带宽降到600k。另外我们支持1080p高清直播,支持本地文件的打开,市面上的直播PPT展示通常是把每页内容压缩成图片,而页面呈现的效果就无法保证了,布卡甚至可以将文件中的视频和音频全部保存下来,老师在讲课的时候可以原封不动的呈现整个PPT的内容。

唐通:CC视频由于是做ToB服务的,所以所有的技术和产品都围绕着场景化这一特色来展开,除了提供直播基础的视频流和聊天之外,我们会针对不同场景的用户提供不同的解决方案。 比如,针对教育场景,我们专门提供了互动白板、问答、点名、试卷等功能。而针对金融直播场景,我们会提供桌面共享,问卷调查等功能。以视频技术为基础,针对不同的用户类型提供更多有价值的功能,是我们一直在追求的。

郝明非:在互联网公司中,金山云是最重视算法投入的,拥有十几人的算法团队,自研的H.265编码器在世界大赛中获得软件编码第一,使用时感觉不到和H.264资源占用的区别,并且完成了服务端、客户端全配套,真正在大客户中落地。金山云直播SDK是另一个特色布局,在功能演进中,快速响应行业需求,积极布局新功能并引领直播市场新玩法,引领新玩法的核心就是组件化,一周一个迭代速度,深耕每个处理环节,通过组件化方案可以无缝支持无人机直播、第三视角直播等使用场景。

张弩:百家云是一家专注教培行业的互动视频云服务厂商,提供面向教育行业的直播、点播的一站式解决方案。百家云的一些技术特点:

  1. 全平台支持、手机直播授课
  2. 海量并发、弹性扩容
  3. 多视频互动、布局灵活
  4. 本地 云端录制
  5. 加载快、延迟低
  6. SDK接口丰富、集成便捷
  7. 几千万小时在线直播经验

Ant:在4月22日的『LiveVideoStack Meet北京:后直播时代技术』上,剧透下将分享哪些有料有趣的内容?

唐赓:2015年是直播业刚开始起步的年份,映客、花椒都是2015年4月左右起步的,我在7月份加入,算是从起步阶段就参与进来了。主要还是简单介绍一下自己在这个过程中的经历,技术路线的变化,以及现在在做的一些尝试和对将来的思考。

张弩:我会分享以下内容:在低延迟的教育应用上做的一些尝试;一些新的技术尝试,比如VR接入、联麦等;针对教学场景的配套硬件,手写板、双摄像头、双师硬件等集成;海外线路建设的一些经验等。

张玺辉:我会重点介绍布卡互动如何做到减少卡顿、掉线和延迟的,包括支持大规模、高并发的网络架构,音频与视频的自适应码率调整,以及硬件适配等。

唐通:到时候将会分享如何实现16人连麦的流媒体MCU,以及如何实现互动白板等。

郝明非:很有幸经历了完整的直播元年,在2015年底受ArchSummit邀请分享了金山云在移动直播上的最佳实践,经历了2016年,架构和思路也在不断演进,希望能借这次分享做下总结,包括我们的服务端架构是什么样的?客户端架构是什么样的?背后的原因是什么?如何做好视频云服务的角色?同质化竞争的大环境下作为技术和通道提供方如何突破?

刘文:届时我想先对全景内容的生产、展示过程先做个简单的回顾。然后主要分享下我们在做全景产品上的思路,全景内容需要考虑的一些技术挑战和我们的实践经验。例如全景图尺寸一般都比较大,怎么提升加载速度、降低带宽成本,以及移动端可能遇到的问题等。

题图来自电影《十一罗汉》海报

0 人点赞