点击上方“LiveVideoStack”关注我们
随着远程教育、远程办公、在线娱乐等场景的不断发展与成熟,空间音频、高清语音、智能语音等都面临着更高的要求。3月5日广州站沙龙我们将与大家一同探讨音频技术与体验创新。本场沙龙邀请到的讲师有:网易资深音频算法工程师 张龙、百度YY事业部资深音频算法专家 陈超、荔枝资深音频研发工程师 丁勇竣及虎牙AI基础技术部高级语音算法工程师 陀得意。更多精彩内容现场揭晓!
*本场沙龙将进行同步直播,不方便到场可报名线上观看哦!
讲师与议题
张龙
网易智企
云信音视频实验室
LiveVideoStack Meet
张龙,就职于网易智企 云信音视频实验室,毕业于中国科学技术大学信息与通信工程专业,获博士学位,主要研究和业务落地领域:语音增强和阵列语音信号处理。在音频领域发表学术文章5篇,申请相关专利6项。目前从事音频信号增强和动态增益控制等研发工作。
TOPIC:实时通信服务中的语音解混响算法实践
随着音视频通信会议越来越普及,与会各方会在不同环境中遇到越来越明显和有差异的混响场景,譬如大会议室、玻璃会议室和小房间且隔音材料不佳场景等。为了保证更好的听音可懂度和舒适度,通信中的语音解混响需求显得愈来愈重要且紧迫。
本次演讲将分享网易云信在语音解混响提升通信效果方面的一些研发进展和观点,重点研究基于自适应结合双麦相关性的方案,总体目标在尽量保真语音下提升解混响效果。
陈 超
百度YY事业部
资深音频算法专家
LiveVideoStack Meet
陈超,曾经任职于bigo、多益网络、小度科技等公司,长期专注音频算法和架构相关工作,目前担任百度YY事业部资深音频算法专家。具有丰富的音频3A算法经验和音频知识。研发成果应用于小度在家,YY直播等产品。
TOPIC:信号处理音频算法结合深度学习方法的开发框架
介绍如何将信号处理和声学知识与深度学习结合,应用在实时通话场景;当下,深度学习逐渐成为音频算法的开发的主流,如何将过去信号处理的知识和深度学习工具结合是一个重要的话题。
分享内容首先阐述当前音频算法开发中传统方法和深度学习方法的发展动向。其次,介绍音频数据生成框架,说明数据框架如何服务深度学习算法。最后,展示YY RTC中音频算法的处理框架和效果。
丁勇竣
荔枝
资深音频研发工程师
LiveVideoStack Meet
丁勇竣,荔枝资深音频研发工程师。2018年加入荔枝,主负责录播和直播音频引擎技术研发,荔枝doreme实时语音通信技术的模块设计和功能开发,对流媒体传输及其处理有较丰富的工程经验。
TOPIC:荔枝声音直播技术的演变
随着语音直播业务产品形态的不断变化,从早期的单人直播,到直播加连线,再发展为多人实时互动语聊,推拉流技术也在不断更迭。本演讲将分享荔枝声音直播技术与业务需求的共同演进的历程及其一些关键问题的思考和实战经验。
陀得意
虎牙AI基础技术部
高级语音算法工程师
LiveVideoStack Meet
陀得意,曾经任职于腾讯 AIPD & AILAB,目前担任虎牙AI基础技术部高级语音算法工程师,主要从事语音算法的预研和落地工作,以多模态合成算法为主,兼顾理解类(说话人识别和增强)算法。研发成果应用于企鹅极光盒子、数字人艾灵、虎牙直播等产品。
TOPIC:多模态语音内容生成算法实践
随着直播产品在弹幕智能化交互、云游戏、虚拟开播、元宇宙等内容场景的深耕和玩法探索,智能化的语音内容生成能力在其中发挥着越来越重要的作用。
本次演讲将分享虎牙AI语音团队在智能化的语音内容生成技术中的研发和实践。首先,阐述直播产品下语音内容生成技术的背景和挑战;然后,重点介绍团队在 多情感、多语音、小数据量的语音合成,语音转换,语音驱动数字人,音乐智能 等技术上的研发进展和观点;最后,对未来工作进行展望。
圆桌:全景声学与沉浸体验
全景声学作为沉浸体验的关键一环,如何真的实现元宇宙的愿景?这里涉及到技术实现,包括硬件到软件,还与行业痛点与场景息息相关。如何找准定位,让全景声学尽快落地。
点击阅读原文或扫描下方日程海报上的二维码即可报名参与~
日程海报
友情提醒:由于防疫要求,线下参会需在活动前一天提供您的行程码及健康码,请确保14天内未到达中高风险地区。烦请将截图发送至邮箱:rainy.gong@livevideostack.com,感谢配合!
关于LiveVideoStack Meet更多信息你可以访问:https://meet.livevideostack.cn/。
如果你想在LiveVideoStack Meet上输出talk、参与讨论,请联系 editors@livevideostack.com 。