最新 最热

Milvus 向量数据库进阶系列丨部署形态选型

在和社区小伙伴们交流的过程中,我们发现大家最关心的问题从来不是某个具体的功能如何使用,而是面对一个具体的实战场景时,如何选择合适的向量数据库解决方案或最优的功能组合。在 “Milvus 向量数据库进阶” 这个系列文...

2024-07-31
1

利用大型语言模型和扩散模型大规模生成视觉最小变化数据,提升VLMs的细粒度理解能力 !

细粒度地理解目标、属性及其关系对于视觉-语言模型(VLMs)有效泛化到新的、未见过的场景和构图至关重要。以往的研究如ARO [40] 和 Sugarcrepe [8],强调了VLMs在这一领域的不足,主要关注于理解两个非常相似的标题之间的细...

2024-07-31
1

OpenSU3D 利用2D基础模型,构建实例级3D场景表示,超越当前所有3D场景理解水平!

人工智能技术的迅速发展已经引发了一系列社会、经济和文化变革。在众多领域中,这项技术已经成为了创新和增长的关键驱动力。然而,随着人工智能技术的广泛应用,作者也必须面对一系列挑战和问题。本文将探讨人工智能技...

2024-07-31
1

斯坦福提出 ExPLoRA 高效扩展预训练 Transformer 在无监督领域的突破 !

预训练基础模型[1]用于自然语言和自然图像在历史上一直是计算密集型的,通常仅限于拥有大量资源的组织。然而,近期参数高效微调(PEFT)技术的进步,包括低秩适应(LoRA)等,激发了极大的兴趣。这些方法旨在基于这样的假设:对预训练...

2024-07-31
1

当 LLMs 步入3D世界,通过多模态大语言模型对3D任务的调查和元分析 !

大型语言模型的出现标志着自然语言处理领域的一个变革性时代,使机器能够以前所未有的方式理解、生成和与人类语言互动。然而,作者周围的现实世界本质上是三维的,理解三维空间环境对于涉及在这些三维空间内进行感知、导航...

2024-07-31
1

Youtu Lab, 腾讯, SJTU, BAAI, ECNU 联合调查高效的多模态大型语言模型报告!

大规模预训练是人工智能领域的一种领先方法,通用型模型(如大型语言模型和多模态模型)已经在许多任务中超过了专业深度学习模型的表现。大型语言模型(LLM)的卓越能力激发了人们将它们与其他基于模态的模型融合以增强多模态...

2024-07-31
1

WWW 2024 | FCVAE:从频率角度重新审视 VAE 在无监督异常检测中的效果

时间序列异常检测(AD)在 Web 系统中扮演着至关重要的角色。各种 Web 系统依赖时间序列数据来实时监控和识别异常,并启动诊断和修复程序。近年来,由于具有出色的去噪能力,变分自编码器(VAEs)在异常检测中备受青睐。...

2024-07-31
1

FPGA中的DSP-Packing: 提高算法性能/功耗和效率

今天来看这篇论文:论文讨论了一种方法来更有效地利用现代FPGA中集成的数字信号处理器(DSP)资源。具体来说,该方法专注于如何在单个DSP块中进行低精度算术运算的打包,以提高计算密集型算法的性能、功耗和面积效率。...

2024-07-31
1

厦门大学刘向荣团队提出MFE模型,通过多模态特征提取预测蛋白质-配体结合亲和力

在药物发现领域,准确有效地预测蛋白质与配体之间的结合亲和力对于药物筛选和优化至关重要。然而,目前的研究主要是利用基于序列或结构的表征来预测蛋白质与配体的结合亲和力,而对蛋白质与配体相互作用至关重要的蛋白质表...

2024-07-31
1

ICML 2024 | FlashST:一个简洁有效新范式,助力智慧城市时空预测

交通预测旨在准确预测城市未来的交通流动模式,需要同时考虑时间与空间维度。但是,分布偏移现象是该领域的一个主要难题,因为现有模型在遇到与训练数据分布差异显著的测试数据时,往往难以实现有效的泛化。...

2024-07-30
1