最新 最热

解锁MySQL性能瓶颈!超实用的10种优化方法大揭秘

解决MySQL性能瓶颈非常重要。通过优化MySQL性能,可以保证系统稳定运行、提供良好的用户体验、确保业务正常运营,并为未来的扩展和增长奠定基础。

2024-08-08
1

Power-LLaVA:大语言模型结合视觉技术,提升检测效率 !

在过去的几年中,电力输电线路巡检领域取得了显著的进展,这主要得益于深度学习技术的应用。例如,DF-YOLO[1]通过结合可变形卷积(DCN)和SimAM注意力机制来提升原始YOLOv7-tiny的性能,有效提高了输电线路外来物检测的准确性。G...

2024-08-08
1

IntelliJ IDEA 2024.2最新激活首秀!这才是稳定、安全、有保障的激活!

IntelliJ IDEA 2024.2 已经到来!终于迎来了IDEA 2024的第二个大版本。

2024-08-08
1

EDAFormer: 一种新型的编码器-解码器注意力 Transformer 用于高效语义分割 !

语义分割旨在为整张图像获取准确的像素级预测,是计算机视觉领域最基本任务之一[32, 42],并被广泛应用于各种下游应用。

2024-08-08
1

VSSD 在图像分类、检测与分割中的应用, 刷新基于 SSM 的模型 SOTA 榜 !

近年来,由Vision Transformer(ViT)[9]引领的视觉 Transformer (vision transformers)在计算机视觉领域取得了巨大成功。得益于注意力机制的全局感受野和强大的信息建模能力,基于视觉 Transformer 的模型在分类[7]、检测[32]...

2024-08-08
1

STN 也来卷 YOLO 了,提升图像检测的质量,并可用于下游应用 !

植物表型分析对于作物改良[1]、产量优化[2]和可持续实践[3]至关重要。人工智能(AI),特别是目标检测算法,已经改变了植物表型分析,提高了效率和性能[4]。You Only Look Once(YOLO)已经在各种农业应用中有效地使用,例如害虫检测...

2024-08-08
1

南洋理工提出 Nested-TNT,提升 Transformer 效率,在视觉识别任务中的性能飞跃 !

Transformer的诞生[23]开启了大型模型的时代,并加速了自然语言处理领域的发展。Transformer的提出解决了传统卷积神经网络(CNNs)[1]在捕捉全局特征方面的不足,并提高了模型的泛化能力。与传统的循环神经网络相比,Transform...

2024-08-08
1

无需训练,kNN-CLIP 在图像分割中的应用 !

在图像分割领域,圣杯是能够基于文本 Query 准确分割任意概念图像。随着视觉-语言模型(VLMs)如CLIP的迅速发展,这一任务变得更加可行。当这些模型应用于语义和全景分割时,显示出在处理广泛的视觉数据词汇方面的潜力。然而,尽...

2024-08-08
1

卡内基梅隆大学 & 微软研究院引入 Med-VTAB 用通用预训练权重提高ViTs在视觉任务上性能 !

深度学习最近的进展极大地推动了计算机视觉领域的发展,尤其是引入了视觉 Transformer (ViTs)。这些模型一旦在大规模数据集上预训练,就已在广泛的视觉任务中展示了卓越的能力。通过特殊的学习层或 Token 等机制,ViTs能够适...

2024-08-08
1

MIT & Caltech & AWS 提出 ALDI,目标检测新突破, 超越现有方法,再次刷新 SOTA!

ALDI++ 在 Cityscapes Foggy Cityscapes 上的AP50超过了先前最先进的方法+3.5,在 Sim10k Cityscapes 上超过了+5.7 AP50(作者的方法是唯一一种超过公正基准线的方法),在 CFC Kenai Channel 上超过了+2.0 AP50。作者的...

2024-08-08
1