最新 最热

CSEC:香港城市大学提出SOTA曝光矫正算法 | CVPR 2024

论文: Color Shift Estimation-and-Correction for Image Enhancement

2024-08-28
0

FlexAttention:解决二次复杂度问题,将大型视觉语言模型的输入提升至1008 | ECCV 2024

论文: FlexAttention for Efficient High-Resolution Vision-Language Models

2024-08-28
0

PHP大模型深度学习库TransformersPHP

TransformersPHP是一个工具包,PHP开发人员可以轻松地将机器学习魔法添加到他们的项目中。你可能听说过Hugging Face的Python库,它以处理文本而闻名,比如总结长文章,在语言之间进行翻译,甚至是与图像和音频相关的任务。Tran...

2024-08-27
1

Bi-MTDP:通过二值网络加速多任务密集预测,又快又提点 | CVPR 2024

论文: Efficient Multitask Dense Predictor via Binarization

2024-08-27
0

One-for-All:上交大提出视觉推理的符号化与逻辑推理分离的新范式 | ECCV 2024

论文: Take A Step Back: Rethinking the Two Stages in Visual Reasoning

2024-08-27
0

EXITS:基于极值点低标注成本弱监督实例分割 | CVPR 2024

论文: Extreme Point Supervised Instance Segmentation

2024-08-26
0

Swahili-text:华中大推出非洲语言场景文本检测和识别数据集 | ICDAR 2024

论文: The First Swahili Language Scene Text Detection and Recognition Dataset

2024-08-26
0

DLAFormer:微软提出多任务统一的端到端文本分析Transformer模型 | ICDAR 2024

论文: DLAFormer: An End-to-End Transformer For Document Layout Analysis

2024-08-22
0

SLAB:华为开源,通过线性注意力和PRepBN提升Transformer效率 | ICML 2024

论文: SLAB: Efficient Transformers with Simplified Linear Attention and Progressive Re-parameterized Batch Normalization

2024-08-22
0