什么是多模态?
多模态指的是多种模态的信息,包括:文本、图像、视频、音频等。 它像人类利用视觉、嗅觉、味觉、听觉等多感官理解现实世界一样,希望充分利用文本、图像、语音和视频等多种模态,这就是「多模态学习」。多模态学习的研究时间不算太长,但应用前景非常广泛,如淘宝搜图、AI字幕、AI虚拟数字人、仿人交互、智能助手、商品推荐和信息流广告、视频帧人脸帧的图向量检索、语音交互等等。
不过, 要说多模态技术真正实现了落地,似乎还太早,从多模态数据标注到跨模态转化,该领域都面临着众多挑战。这就需要研究社区和业界持续探索新的发展方向和技术范式。 我们很荣幸邀请到了在人工智能、计算机视觉领域有着丰富的一线实战经验的唐宇迪博士,利用2天的时间,为大家系统地梳理多模态技术。
直播内容
01
PART
直播时间 :8月17日-8月18日,20:00-22:30
Day1:深度学习CNN卷积神经网络算法精讲
- 神经网络模型知识点分析
- 神经网络模型整体架构解读
- 卷积神经网络整体架构及参数设计
Day2:对比学习与多模态任务解读
- 深度学习中对比学习的思想与应用方法
- OpenAI 多模态任务CLIP算法解读
- CLIP应用实例与效果分析
- 多模态任务在各领域的应用实例分析
对多模态技术感兴趣的同学,扫下方二维码,预约直播。
原价199
扫描下方二维码
0.02元报名 !
福利较大,限前100名
02
PART
主讲老师
直播收获
03
PART
开放全部代码,课后复用方便高效
对于课程中涉及到的全部代码,我们将免费开放!
你可以用于课后自查、复习巩固,甚至复用于日后的业务,方便高效!
讲师带练,伴随式编程环境
你将获得伴随式的编程环境。
讲师带练、运用科学的方法引导,帮你消化疑难知识点 同时还有@唐宇迪老师将会分享 , 一线热门技术和行业经验,众多学员亲测有效的一套技术提升方案,帮你摆脱迷茫,明确成长方向!
三位一体跟踪服务,项目实战驱动 , 深刻理解原理
只要报名,就能收获讲师、助教、班班全程三位一体跟踪式服务,24H为你答疑解惑。
同时还有来自五湖四海的大牛做同学,技术氛围浓厚,想不进步都难!
完课礼包
注意:已整理到网盘 , 添加助理 , 报名课程后免费领取!