在我经历的上百场技术分享中,将分享打印成演讲稿的讲师寥寥,一共有3次。曾小伟的分享是其中一次。事实证明,这种“愚笨”的方法不仅令身为组织方的我十分感动,而且实际的输出效果也是不错的。在曾小伟“LiveVideoStack Meet上海:多媒体开发新趋势”的分享后,我们相约做一次邮件采访。在采访中,他聊起了自己的入行经历,被技术的深度和广度困扰过,也被互联网金融“不可思议”的薪资吸引过。他还说,做的越多,越觉得自己无知。他是,曾小伟 PP云技术副总监。
策划 / LiveVideoStack
LiveVideoStack:曾小伟你好,能否简要介绍下自己,包括目前的主要工作及关注领域?
曾小伟:2006年刚入行时有幸参与到一个高性能计算处理项目中,从周边的同事吸取很多营养;接下来做了2~3年与流媒体相关的嵌入式开发,也接触一些流媒体服务端的开发;2010年加入虹软,开始做Codec内核优化和NLP(自然语言处理)方向的内容,并将产出结果服务化;2013后,加入创业公司,2016年加入PP云(属于苏宁集团数据云公司)都在做视频云架构设计和研发管理工作。目前专注于PP云(苏宁视频云)的发展,在优化传统点直播方面、低延迟直播(WebRTC应用),AI与视频云的结合等方面花费较大精力。
LiveVideoStack:感谢你在“LiveVideoStack Meet上海:多媒体开发新趋势”的分享,你每次分享都要写成演讲稿吗?像你这么认真的分享者不多见,也期待再次看到你的分享。
曾小伟:准备讲稿,其实不是出于认真,而是担心自己记性不好或是紧张,怕把一些关键点给漏掉(囧一个)。刚从事流媒体行业时,能参考的资料很少,记得在做Codec的研发时,基本上很多情况下就是啃spec文件和一些陈年的课本。最近两年和流媒体相关技术网站或组织逐渐多了起来,从业者学习和查资料方便了太多,LiveVideoStack就是其中非常不错的一个。LiveVideoStack我在这次分享前很久就接触过,当时查技术资料看到了,发现其中的内容专业性很好,也就开始定期关注。非常期待与LiveVideoStack的再次合作。
LiveVideoStack:从事多媒体服务器开发和架构设计十多年,这么多年做一个领域不会产生疲劳感么?中途是否(考虑)转换过轨道?
曾小伟:首先,得承认,确实动摇过,在创业公司时,遇到了P2P金融公司将APP开发者薪资炒到“不可思议”的情况,我也曾考虑过是否放弃自己熟悉的领域,去转APP开发挣钱。
当时一方面因为觉得自己在视频云架构方面还不够资深,至少得做出点样子来吧,另外也还好这波泡沫破的比较快,否则没准已经转行了。现在的我经常这样一个感觉,做的越多,越觉得自己无知。
对于流媒体、系统架构方面的知识有了一定程度了解后,发现自己在网络方面深度又不够;在了解和实践一些AI的知识与算法时,又发现自己数学是短板,所以只能通过不断的学习给自己充电。学习中,会发现一些更有广度和深度的关联知识需要去学习。在这样的过程中,也会越来越有信心(因为自己无知,但是不努力的人更无知),自己所从事的方向和学习的东西,后面还有很长的路可以走,是一个很好的饭碗。
LiveVideoStack:回顾过去这10多年,多媒体技术不断迭代,公司起起落落,可以用哪些技术或其他关键词来总结呢?
曾小伟:开源:FFmpeg,WebRTC等平台的开源和逐渐成熟,大大降低了流媒体开发的入门门槛,只有更多人入门了,整个行业才会有更多更好的产品出现。
直播、短视频:前几年火起来的各大直播平台,改变了大家的社交习惯,短视频产品更是现在的流量和在线时长杀手,用户的大量使用,使得资方愿意介入,也促进了技术向前发展。
编解码:从早期的Mpeg-1,到现在最常用的H.264,再到HEVC,VP9,AV1等等,编解码技术不断进步,压缩率、视频的清晰度不断提升,这将给视频用户带来越来越好的观看体验。
AI:AI已经在流媒体领域中的很多方面逐渐落地,比如图像识别,图像智能压缩,窄带高清等;也有一些擦边的结合,比如视频智能推荐等,后续应该会有更加深入的结合。
5G:其实5G可以更泛化的理解,就是更好的基础网络层。更大的带宽,更好的传输速率,也会对流媒体领域提出挑战,今年初各大厂都提到的8k,4k直播,真的落地被用户使用,离不开这些更好的基础网络的普及。
LiveVideoStack:音视频技术往往非常专业,这就导致需要钻研到足够的深度才能脱颖而出。但这会导致职业的选择空间变窄。如何在技术深度与广度上做好平衡呢?
曾小伟:说实话,这个问题我其实也没有一个很好的答案,人的精力有限,如何找到一个平衡点,做到合适的深度和广度是很难的。我目前做的,是否合理,是否经得起考验,只能靠时间验证了。
LiveVideoStack:学习多媒体开发的技术人普遍的感触是“门槛很高,学好更难”。你有哪些学习建议?有哪些文档、图书、资料推荐?
曾小伟:打好基础:包括数学基础,算法基础,还有一些数字信号处理的理论基础,网络协议的基础。俗话说,知其然知其所以然。如果开发者理解了信号处理的一些基础知识,那么在使用FFmpeg的时候,就很容易理解每个参数的意义,而不是云里雾里,进一步使用FFmpeg提供的函数时,也很容易理解为什么要这样做,写出更好的代码。
多实践:现在FFmpeg,GStreamr,Nginx,SRS等软件,代码开源,部署容易,本身的说明文档和网上的一些总结,能让人很快就把他们用起来,只有实践了,才能进步,才能更深的理解。
推荐的资源:一些技术网站,比如雷神(RIP)的blog(https://blog.csdn.net/leixiaohua1020),LiveVideoStack等;另外,FFmpeg的官网作为字典也值得收藏;一些基本的数学、算法、信号处理、网络方面的的书,摆在手边,有问题时候随时翻翻。
顺便推荐几本书籍:
《FFMpeg从入门到精通》 FFmpeg的指南 《深入理解Nginx》 结合nginx rtmp moudle的文章看,对于流媒体服务器开发很有帮助 《TCP/IP详解》 《UNIX网络编程》 如前面提到,做流媒体对于网络协议一定要打好基础
LiveVideoStack:展望2018年,你认为哪些技术将成为音视频领域的热门?
曾小伟:AI:在音视频领域内某些方面已深度落地,将推动音视频分析、编解码的技术和能力向前发展,各大视频公司也在研究和推进各种相关技术。
WebRTC:基于RTMP的直播能力,已在各种直播场景中捉襟见肘,WebRTC技术带来的低延迟,点对点技术,预计将成为新一轮发展的热点。
LiveVideoStack:现在CDN带宽是许多视频平台的主要成本支出之一,随着4K视频日渐增多,5G商用已在在计划中,如何从技术手段降低CDN成本?PP云有哪些技术方案来降低带宽成本?
曾小伟:我认为降低CDN带宽成本,可以做两方面的努力:
第一部分,解决如何在同样的带宽(也就是码率)情况下,传输更高清的音视频,目前的HEVC,AV1,VP9等编码器都在试图解决这个问题,不少企业也在自研窄带高清技术,PP云在这方面投入了专业的团队,在HEVC codec内核优化、不同点播视频场景下使用不同压缩参数来降低码率等方面都取得了一定的成果。
第二部分,是如何少从CDN上下载数据,PPTV是通过P2P传输技术起家的,P2P技术在节约带宽,尤其是点播带宽方面,有很大的效用;
LiveVideoStack:关于Codec,H.264已经不能满足清晰度更高的视频编解码的需求了。在Google、Netflix等巨头的支持,AV1势头很猛。而HEVC因为专利风险,正在面临来自AV1的挑战。您如何看待未来几年Codec的发展趋势?PP云是如何考虑下一代Codec的?
曾小伟:AV1必然会对HEVC造成巨大的冲击,HEVC后续会如何应对,是靠改进能力打败AV1,还是索性免费,不得而知。但是对于视频公司来说,有AV1这样的免费方案出来和HEVC打擂,是一件非常好的事情,对于H.264能力的不足,后续有了多种选择,不用成天担心HEVC的专利陷阱。
对于几个新的Codec,PP云都投入了人力进行研究和开发,HEVC的优化和 WebRTC中VP9的使用都做了落实,后续对于AV1也是欢迎的态度。但是从另外一方面说,我们也不会太激进的推出一些颠覆,比如全面在WebRTC中使用VP9,放弃VP8,这对很对设备或老的浏览器是不现实的。应该是跟随行业形势,先做技术储备,推出一些实验性产品,在业内风向发生变化时,能够及时跟进。