最新 最热

音视频开发之旅(92)-多模态Clip论文解读与源码分析

在做分类 检测以及分割任务时,数据的标注非常关键, 比如可用于分类任务的ImageNet数据集共有120万张图片1000个分类,  可用于目标检测和分割任务的COCO数据集共有33万张图片80个目标类别. 传统的图像分类模型通常在...

2024-09-07
4

从奥运梗图,实测明星产品MiniCPM-V 2.6

这次巴黎奥运会,奥运健儿创造历史的速度太快了,导致每天早上都会有不同的热搜,普通人根本就看不过来。除了关注奥运健儿在赛场上的表现之外,本次巴黎奥运会最出圈的可能就要数各种名场面的出现了。...

2024-08-12
1

【论文解读】针对生成任务的多模态图学习

多模态学习结合了多种数据模式,拓宽了模型可以利用的数据的类型和复杂性:例如,从纯文本到图像映射对。大多数多模态学习算法专注于建模来自两种模式的简单的一对一数据对,如图像-标题对,或音频文本对。然而,在大多数现实世...

2023-11-10
1

PRCV 2023:语言模型与视觉生态如何协同?合合信息瞄准“多模态”技术

近期,2023年中国模式识别与计算机视觉大会(PRCV)在厦门成功举行。大会由中国计算机学会(CCF)、中国自动化学会(CAA)、中国图象图形学学会(CSIG)和中国人工智能学会(CAAI)联合主办,多媒体可信感知与高效计算教育部重点实验室、厦门...

2023-10-17
2

2022 年中回顾|大模型技术最新进展

本文回顾了过去 12 个月以来,国内外大模型的发展趋势,包括百花齐放的国产大模型、新秀不断涌现的多模态模型、萌芽中的通用能力模型等等,并对大模型新应用、预训练框架等方面的进展进行了总结。...

2022-07-25
2