最新 最热

「无需配对数据」就能学习!浙大等提出连接多模态对比表征C-MCR|NeurIPS 2023

多模态对比表示(multi-modal contrastive representation, MCR)的目标是将不同模态的输入编码到一个语义对齐的共享空间中。

2023-11-19
0

GitHub 信息动态统计:让你的 Readme 更具吸引力 | 开源日报 No.87

GitHub Readme Stats 是一个开源项目,它可以在 README 文件中动态生成 GitHub 统计数据。该项目的主要功能包括:

2023-11-18
0

微软用GPT-4V解读视频,看懂电影还能讲给盲人听,1小时不是问题

世界各地的人们每天都会创造大量视频,包括用户直播的内容、短视频、电影、体育比赛、广告等等。

2023-11-16
0

arXiv每日学术速递2023.11.15

计算机视觉与模式识别(cs.CV) | 自然语言处理(cs.CL) | 人工智能(cs.AI) | 机器学习(cs.LG) | 机器人相关(cs.RO) | 语音/音频处理(cs.SD/eess.AS)

2023-11-15
1

北大联手腾讯提出LanguageBind  | 更直接的多模态对齐框架,刷新多个榜单!

北大联手腾讯提出LanguageBind | 更直接的多模态对齐框架,刷新多个榜单!

2023-11-14
0

EasyDarwin开源流媒体服务器

EasyDarwin 是基于 go 语言研发,维护和优化的一个高性能开源 RTSP 流媒体服务器,能够帮助流媒体开发者和创业型企业快速构建流媒体服务平台,更快,更简单的实现最新的移动互联网流媒体直播和点播,同步音频和视频的传输,源码...

2023-11-14
1

能跟「猫主子」聊天了!生成式AI带来的全面革命:最快5年内破译第一种动物语言

在《狮子王》、《疯狂动物城》等以动物为中心的作品中,作者经常会将角色拟人化,用人类的思考和交流方式来推进剧情。

2023-11-13
0

北大&腾讯打造多模态15边形战士!语言作“纽带”,拳打脚踢各模态,超越Imagebind

用语言作为与其它模态之间的纽带,冻结语言编码器,然后用对比学习方法,将各个模态映射到一个共享的特征空间,实现多模态数据的语义对齐。

2023-11-13
0

Type-C拓展坞 PDHUB 取电IC方案

根据连接方式的不同,扩展坞常见连接方式包括USB、Type-C、RJ45网口,HDMI等.

2023-11-13
1

WebRTC简介及使用

WebRTC 只是一个媒体引擎,上面有一个 JavaScript API,所以每个人都知道如何使用它(尽管浏览器实现仍然各不相同),本文对 WebRTC(网页实时通信)的相关内容进行简要介绍。...

2023-11-12
1