在线催稿:当一位高级视频算法工程师接受采访

2020-06-09 14:28:02 浏览数 (1)

讲师专访是每一届LiveVideoStackCon举办前的固有“热身”和传统节目,我们夹带着为大会做宣传的私心(却也并不为过),但更多的是希望帮助大家多熟悉、多了解这些在音视频技术领域摸爬滚打多年的工程师、开发者,像朋友一样真心接触、平等交流。毕竟,技术的分享本就不应该居高临下,他们也曾是你,或许有一天,你也将成为他们(大神们请忽略这句)。

声网高级视频算法工程师李佳俐丨

LiveVideoStackCon 讲师专访

大家好,我是李佳俐,一名声网的算法工程师。从读书到进入社会,一直专注于视频编解码、图像处理及相关软硬件等领域的研究和工作。当下我们团队主要是在做新一代编码器的开发以及多种现实业务场景的针对性优化。

我回顾了LiveVideoStack的相关分享,了解之前的分享者都讲了什么,是什么风格,从自己实践的内容中选中了感知视频编码这个主题。从基础知识到实践难点,这些到时候都会与大家共同探讨。

采访李佳俐老师的过程轻松有趣,双方间接性同步反馈、持续性插科打诨:

以上及以下均由LiveVideoStack与李佳俐的采访整理而成。

我们团队专注在做实时音视频通话,所以总的来说其实难点一直都是一个,即对众多技术点在实时音视频领域的创新和转化应用,尤其是在移动平台上。在这方面,主要的限制是移动平台的计算能力以及实时场景的极低延迟需求。因此,在对技术的应用和创新上,比较强调抽丝剥茧,区分和掌握最核心最有效的部分算法,同时对各种平台的特性也要有深入了解,才能有效转化应用。

对于技术难点的攻克,我的一个感受是,思考问题要从根源出发,跳出原来的框架,避免一叶障目不见泰山的情形。另一个方面大概是过程中对一些技术点的追求要把握和区分学术和产品的不同,从学生时代学术问题的思考方式调整到现实产品的思考方式。

疫情期间,在家里和线上工作的时间更多,没出去活动眺望远方,最受伤的大概是眼睛,感觉快瞎了,哈哈。倒是对公司的发展更有信心了,更能切身感受和思考未来的技术方向;哪些技术可以派上实际用场,哪些需要做相应的调整才能放到某个业务里面去。疫情给我们带来了许多麻烦不假,但也为我们开启了一种新的生活方式,至少是给了我们多一种选择。声网的宗旨就是让实时音视频成为像空气和水一样无处不在、便利可取的技术,能为这样一种新的生活方式提供更多的便利。

从一些市场调查报告看,2019年使用最多的codec仍然是 H.264/AVC,但是H.265/HEVC的使用正在逐渐变多。AV1得到几个大厂的支持,进展越来越快,计算速度也有望实时。未来可能是这几个codec瓜分市场,各自占据不同的业务场景。随着5G的推进人们的想象力会得到进一步释放,更多新的业务场景会出现,更高的使用体验会提出,MPEG的下一代编解码器VVC已经定稿,新的视频编解码标准开发还会继续。标准先行,应用随后,未来可期。

声网对不同的业务场景会有不同的优化重点,比如追求低延迟的场景对码控有特殊的要求,追求低带宽的场景我们开启各种降低码率需求的工作等,当然我们也会提供一般场景的全局最优的组合方式。

要是问职业理想的话,大概就是做个一流的视频技术专家,对视频编解码、前后处理、质量评价等等领域都积攒些经验,最终能够融会贯通,在技术瞬息万变的今天能够对技术、产品等有正确的判断和有益的贡献,少浪费社会资源。

The Last Qustion:

编辑:Coco Liang

0 人点赞