最新 最热

【人工智能】Transformers之Pipeline(十三):填充蒙版(fill-mask)

pipeline(管道)是huggingface transformers库中一种极简方式使用大模型推理的抽象,将所有大模型分为音频(Audio)、计算机视觉(Computer vision)、自然语言处理(NLP)、多模态(Multimodal)等4大类,28小类任务(tasks)。共计覆盖32万个...

2024-09-03
1

湖南大学团队提出APN模型,通过属性引导的原型网络实现分子性质预测

分子性质预测(MPP)在药物发现过程中起着至关重要的作用,为分子评价和筛选提供了有价值的见解。尽管深度学习在这一领域取得了许多进展,但它的成功往往取决于大量标记数据的可用性。与之相比,小样本MPP是一个更具挑战性的...

2024-09-02
1

神经网络泛化能力研究!

论文标题:Feature Contamination: Neural Networks Learn Uncorrelated Features and Fail to Generalize

2024-09-02
1

极简演示,机器学习建模全流程:从数据到模型部署的全面指南

机器学习已经成为现代技术领域不可或缺的一部分。无论是推荐系统、图像识别还是自然语言处理,机器学习都在发挥着重要作用。但是,如何从原始数据到最终的机器学习模型呢?让我们一起探索机器学习建模的完整流程。...

2024-09-02
1

Chat RAG-基于检索增强生成(RAG)的交互式编程助手,可本地部署

Chat RAG 是一个基于检索增强生成(RAG)技术的交互式编程助手,它提供了一个用户友好的 Gradio 界面,允许用户与各种语言模型进行交互,以获得编程问题的解答。该项目结合了先进的自然语言处理技术和灵活的用户界面,为开发者提...

2024-09-02
1

11.9K Star!强大的 Web 爬虫工具 FireCrawl:为 AI 训练与数据提取提供全面支持

在这个信息爆炸的时代,数据就是力量。尤其是对于开发者来说,获取并利用好数据,就意味着拥有更多的主动权和竞争力。

2024-09-02
1

『GitHub项目圈选24』盘点本周 火火火 的开源项目!

FreeCodeCamp 是一款开源的在线编程学习平台,是GitHub全球排行最高的项目,Star达400K。

2024-09-02
1

xGen-MM(BLIP-3), 一种开放大型多模态模型 !

大型多模态模型(LMMs)因其潜在的应用和新兴能力而受到广泛关注。最近,专有模型[2-5]和开源LMMs[6, 1, 7-11]的进展突显了这一领域的快速进步和日益增长的兴趣。然而,尽管取得了这些进步,开源模型与专有模型之间在开放权重...

2024-09-02
1

CLIPCleaner 利用视觉语言模型解决噪声标签学习的自我确认偏差问题 !

最近,基于样本选择的方法已成为识别干净标签的样本的主导模式。其中最常用的样本选择策略是小损失机制,因为模型在训练过程中倾向于提前适配干净样本而不是噪声样本,这导致了干净样本的相对较小损失。然后,大多数方法主要...

2024-09-02
1

北航提出 Unified-loU,用于高品质目标检测的统一loU !

边界框回归(BBR)模块是目标检测模型中的一个重要部分。一个好的、准确的边界框回归函数直接决定了目标定位的准确性。如果预测框的定位精度较差,很容易导致目标真假或缺失的检测。边界框回归模块已经广泛应用于许多高级...

2024-09-02
1