最新 最热

论文解读:Ad Hoc Transactions in WEB Applications

《Ad Hoc Transactions in WEB Applications: The Good, the Bad, and the Ugly》由上海交通大学并行与分布式系统研究所发表于SIGMOD22,论文主要调研了在WEB应用中处理数据并发操作类业务的主流方法,包括基于数据库事...

2023-11-28
1

一个提示,让Llama 2准确率飙至80.3%?Meta提出全新注意力机制S2A,大幅降低模型幻觉

比如偏见(或包含不良信息)、幻觉(编造不存在的事情)、推理能力仍然比较弱(尽管有了step by step),还有一个问题是LLM倾向于迎合使用者的观点(阿谀奉承)。...

2023-11-28
1

简化版Transformer来了,网友:年度论文

Transformer 架构可以说是近期深度学习领域许多成功案例背后的主力军。构建深度 Transformer 架构的一种简单方法是将多个相同的 Transformer 「块」(block)依次堆叠起来,但每个「块」都比较复杂,由许多不同的组件组成,需...

2023-11-28
0

OpenAI 公开 DALL·E 3关键技术!19页论文曝光

这次直接宣布对ChatGPT Plus和企业版用户开放,还连带公开了更多“官方推荐案例”。

2023-11-28
1

2024年IEEE Fellow名单揭晓:「视觉智能」领域十余位华人学者入选!

本次共从被提名的949名候选人中选出323名IEEE Fellow,其中华人学者有116位,占总人数的36%左右。

2023-11-27
1

我的眼睛就是尺!80亿参数OtterHD带你「清明上河图」数骆驼!南洋理工华人团队打造

最近,来自南洋理工的华人团队基于Fuyu-8B打造出了80亿参数的多模态大模型OtterHD。

2023-11-27
0

物理学家证明人类生活在「矩阵」之中?宇宙是「模拟系统」,多系统证实信息演化趋向稳定

朴茨茅斯大学物理学副教授,信息论专家,Melvin Vopson在他的新论文中提出:

2023-11-27
1

GPT-4+物理引擎加持扩散模型,生成视频逼真、连贯、合理

扩散模型的出现推动了文本生成视频技术的发展,但这类方法的计算成本通常不菲,并且往往难以制作连贯的物体运动视频。

2023-11-27
0

谷歌:LLM找不到推理错误,但能纠正它

今年,大型语言模型(LLM)成为 AI 领域关注的焦点。LLM 在各种自然语言处理(NLP)任务上取得了显著的进展,在推理方面的突破尤其令人惊艳。但在复杂的推理任务上,LLM 的表现仍然欠佳。...

2023-11-27
1