音视频技术开发周刊 | 170

2020-11-19 15:18:59 浏览数 (1)

每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。

传输网络

实时5G实时视频流必不可少的6个原因

正如最近在博客中详细讨论的那样,以视频为中心的社交活动,沉浸式娱乐,教育,远程医疗等方面的趋势使网络对实时视频丰富的个人体验的支持成为网络空间新时代的特征。从分散的劳动力投入到视频监控,再到在工程设计,建筑,培训,手术和其他方面的沉浸式协作,实时视频传输也正在成为商业生活中各种应用程序的重要组成部分。

https://www.red5pro.com/blog/6-reasons-real-time-5g-live-video-streaming-is-essential/

引入XDN(体验交付网络)

互联网上无处不在的视频使我们进入了一个过渡点,对实时视频互动体验的支持已开始定义在线参与的下一个时代。

https://www.red5pro.com/blog/introducing-xdn-experience-delivery-network/

Android

细数 2020 年官方对 Android 的那些重大更新

不知不觉,2020 年也已接近尾声,今年虽然困难重重,但是 Android 社区的更新热情却并未消减 ,Google I/O 大会取消的同时,官方也为我们提供了一系列优质的节目:Now In Android[1] 、Kotlin Vocabulary[2]、11 Weeks of Android[3]。本篇文章就带大家看一看今年以来,Android 相关最新的动态,尝鲜我们今后可以使用的功能。

https://mp.weixin.qq.com/s/bh-lI7Ue5x_LmSfZBg_Hsg

编解码

AV1生态现状概览

AV1(Alliance for Open Media Video 1)是 2018 年6月由AOM联盟(Alliance for Open Media,开放媒体联盟)发布的新一代视频编码标准。

https://mp.weixin.qq.com/s/NK2KFfGRD7zfEjANhn2LIw

JPEG Pleno图像编码技术

本篇来自ICIP2020,演讲者是来自意大利Cagliari大学的Cristian Perra博士,演讲主题是 JPEG Pleno图像编码技术。

https://mp.weixin.qq.com/s/kybALVa3OQ3imwuhwzDweA

Fraunhofer多功能视频解码器(VVdeC)

Fraunhofer多功能视频解码器(VVdeC)是一种快速的VVC x86软件解码器实现。解码器支持Main10概要文件中可用的大多数标准功能,但对某些高级功能的支持仍需等待。

https://github.com/fraunhoferhhi/vvdec

腾讯开源国内首个H.266/VVC视频播放器

腾讯O266player的开源不仅是腾讯视频编解码技术进展的又一个重要里程碑,更是腾讯在推动多媒体技术生态不断演进的一个重要布局。未来腾讯多媒体将联合各行业,通过标准制定与产品研发将最新技术输出至行业,为数字化产业建设提供新的技术助力。

https://mp.weixin.qq.com/s/FiLF9b_m8COjahN8aKg9Nw

国内外视频编解码标准体系

针对国内外视频编解码标准,典型涉及的标准组织或联盟包括MPEG、ISO、ITU、AOM、AVS等。从编解码体系角度来看,现有标准组织可粗略分三个阵营。本文就来分别说说MPEG、ITU、AOM、AVS的演进历程。

https://mp.weixin.qq.com/s/yNmKDUtDrNtkZgP_RHjwfw

ICIP2020:VVC帧内编码复杂度分析

本文来自ICIP2020论文《COMPLEXITY ANALYSIS OF VVC INTRA CODING》。

https://mp.weixin.qq.com/s/-5YvoR2vRuzIqCLS_pK9Jg

音视频技术

“云端一体”的智能媒体生产制作演讲之路

智能媒体生产制作的链路当中,生产制作是核心,智能是辅助,那么AI技术是如何融入在整个生产制作流程当中的?阿里云智能视频云 高级技术专家 邹娟在LiveVideoStackCon 2020 北京站的演讲中就智能媒体生产制作的技术演进之路,从三个部分为大家带来详细的讲解。

https://mp.weixin.qq.com/s/E0AHuqT9IfkgNvrwst-bdA

Q音直播编译优化与二进制集成方案

Q音直播抽离成pod库分别引入到QQ音乐和Fan直播两个独立app中,而对于直播业务来讲,直播SDK通过pod本地引入集成到Demo中进行日常直播业务的开发,通过Demo来精简工程规模,提高研发效率。

https://mp.weixin.qq.com/s/5q_PLdLeuuuQnsLrbzaOeQ

大型多语言音像配音

实现嘴型同步对应的自动语言翻译。

https://arxiv.org/abs/2011.03530

实时音视频助力在线教育风口

TRTC全称是腾讯实时音视频,是在腾讯云上以SDK和REST API的方式提供售卖的云服务。腾讯云TRTC客户端的产品架构师蒋磊,将从疫情影响下在线教育市场的变化情况出发,介绍实时音视频实践过程中的踩坑与填坑以及一些新的尝试。

https://mp.weixin.qq.com/s/2XMYXVxoeIJ0irl9R-FPtg

主流VR头显FOV实测:与官方数据差别很大

为了对比15款VR头显实际FOV的大小,德国费尔巴赫的VDC(虚拟维度中心)利用特制的头部模型来进行模拟测量,结果发现15款头显中Pimax 8K视场角达141.5°,Pico G2视场角仅78.5°,几乎每款头显的实际FOV观感都与官方规格有所出入。

https://mp.weixin.qq.com/s/RfTcHLeebTMYMDvQ2SQ7Fg

AI智能

YOLO V4 Tiny改进版来啦!速度294FPS精度不减YOLO V4 Tiny(附论文下载)

为了提高目标检测的实时性,本文提出了一种基于YOLOv4-tiny的快速目标检测方法。它首先使用ResNet-D网络中的两个ResBlock-D模块,而不是Yolov4-tiny中的两个CSPBlock模块,从而降低了计算复杂度。其次,设计了辅助残差网络块,以提取更多的物体特征信息,以减少检测误差。

https://mp.weixin.qq.com/s/fPlnMnwq2R-Pat5Jx1lFMg

算法

大规模视频直播中的关键算法

伴随着2020年大部分的体育赛事、音乐会、节日活动和其他聚集性活动的停滞,面向2021年我们会发现对支持大型活动的流媒体传输的潜在需求是巨大的。业界各公司将怎样分发实时流事件来满足这些潜在的史无前例的需求呢?最近发布在 Algorithm Series的文章深入研究了调整大规模实时视频事件交付的数学和工作流决策算法。

https://mp.weixin.qq.com/s/EB7lccvXhRvcxb7KNA_tGg

0 人点赞