最新 最热

【文献阅读】Split-KalmanNet:一种鲁棒的基于模型的深度学习方法用于状态估计

题目:Split-KalmanNet: A Robust Model-Based Deep Learning Approach for State Estimation

2024-08-08
1

吃了这些云开发数据集和模型,让AI教你做分析

开发者可以通过云数据库的数据模型能力更方便的定义数据结构,自动进行数据校验,自动处理关联关系。同时通过数据模型的数据管理能力,更方便的进行后台数据管理、查询。也能基于数据模型运维分析、AI智能化等能力,帮助各类...

2024-08-08
1

Power-LLaVA:大语言模型结合视觉技术,提升检测效率 !

在过去的几年中,电力输电线路巡检领域取得了显著的进展,这主要得益于深度学习技术的应用。例如,DF-YOLO[1]通过结合可变形卷积(DCN)和SimAM注意力机制来提升原始YOLOv7-tiny的性能,有效提高了输电线路外来物检测的准确性。G...

2024-08-08
1

EDAFormer: 一种新型的编码器-解码器注意力 Transformer 用于高效语义分割 !

语义分割旨在为整张图像获取准确的像素级预测,是计算机视觉领域最基本任务之一[32, 42],并被广泛应用于各种下游应用。

2024-08-08
1

VSSD 在图像分类、检测与分割中的应用, 刷新基于 SSM 的模型 SOTA 榜 !

近年来,由Vision Transformer(ViT)[9]引领的视觉 Transformer (vision transformers)在计算机视觉领域取得了巨大成功。得益于注意力机制的全局感受野和强大的信息建模能力,基于视觉 Transformer 的模型在分类[7]、检测[32]...

2024-08-08
1

南大 & 吉大 & 移动 优化Pipeline设,VLM 和 LLM 助力提升物体图像修复效果 !

扩散模型的快速发展已经革命化了图像修复[1]。文本到图像生成模型使用户能够利用文本或多模态信息控制扩散过程,从而通过将文本或其他模态作为附加线索,允许更个性化的图像修复。同时,研究行人正在尝试更具挑战性的修复...

2024-08-08
1

STN 也来卷 YOLO 了,提升图像检测的质量,并可用于下游应用 !

植物表型分析对于作物改良[1]、产量优化[2]和可持续实践[3]至关重要。人工智能(AI),特别是目标检测算法,已经改变了植物表型分析,提高了效率和性能[4]。You Only Look Once(YOLO)已经在各种农业应用中有效地使用,例如害虫检测...

2024-08-08
2

多模态Mamba分类器,融合3D GAN 与 ViT 进行高效特征提取与分类 !

阿尔茨海默病(AD)是老年人中常见的一种神经退行性疾病,它影响记忆力、认知功能以及日常生活活动。AD通常从轻度认知障碍(MCI)进展而来,尤其是遗忘型MCI(aMCI),其主要特征是记忆力下降。尽管aMCI患者经历了明显的记忆丧失,但他们...

2024-08-08
1

U-Net 架构的演进,结合领域分解与通信网络的超高分辨率图像分割新策略 !

在本文中,大部分计算机视觉领域的深度学习模型专注于低分辨率的2D和3D图像,通常是256×256像素或更小。然而,随着高分辨率图像数据集的广泛应用,由于单个GPU的内存限制,带来了新的挑战,尤其是在图像语义分割等内存密集型任...

2024-08-08
1

南洋理工提出 Nested-TNT,提升 Transformer 效率,在视觉识别任务中的性能飞跃 !

Transformer的诞生[23]开启了大型模型的时代,并加速了自然语言处理领域的发展。Transformer的提出解决了传统卷积神经网络(CNNs)[1]在捕捉全局特征方面的不足,并提高了模型的泛化能力。与传统的循环神经网络相比,Transform...

2024-08-08
1