最新 最热

每日论文速递 | 基于例子还是基于规则:Transformers是如何进行数学运算的?

摘要:尽管在各种复杂任务中表现出色,但现代大型语言模型(LLM)仍然难以处理一些对人类来说简单直观的数学问题,例如加法。虽然我们可以很容易地学习加法的基本规则,并将其应用于任何长度的新问题,但LLM也很难做到这一点。相反...

2024-03-02
0

每日论文速递 | LLM中的大规模激活

摘要:我们在大型语言模型(LLM)中观察到一种经验现象-很少有激活表现出比其他激活大得多的值(例如,100,000倍)。我们称之为大规模激活。首先,我们证明了广泛存在的大规模激活在各种LLM和表征他们的位置。其次,我们发现它们的值...

2024-03-02
0

每日论文速递 | Agent-Pro:通过策略级反思和优化学习进化

摘要:大型语言模型对不同的任务表现出强大的解决问题的能力。然而,大多数基于LLM的代理都被设计为具有复杂提示工程的特定任务求解器,而不是能够通过交互学习和进化的代理。这些任务求解器需要手动制作的提示来告知任务...

2024-03-02
1

pua大模型 - plus studio

这两天看到了一个论文Large Language Models Understand and Can Be Enhanced by Emotional Stimuli 翻译过来叫做 大型语言模型理解并能够通过情感刺激进行增强,听着是一个prompt的论文。...

2024-02-29
1

课程论文-源代码下载器的设计实现

> **摘要:**随着时代的进步以及科技的发展,人们越来越多的需要高效地从互联网上获取所需的信息,然而其对网络的要求和一些站点人为的限制,却也制约了用户对网络信息的获取和保存。对此,针对于一项可以实现将网站数据便捷获...

2024-02-28
1

imec:High NA EUV光刻生态系统已做好了准备!

2月26日,据imec(比利时微电子研究中心)官方消息,在“2024 年先进光刻 + 图案化会议上”,imec将展示 EUV 工艺、掩模和为实现高数值孔径(High-NA)极紫外(EUV)光刻而准备的计量学。imec报告了抗蚀剂和底层开发、掩模增强、光学邻...

2024-02-27
1

Sora理论基础,论文作者解释原理

这是构成Sora基础之一的Diffusion Transformer论文作者关于Sora的一些猜测和技术解释。

2024-02-26
0

求论文:A Conceptual Consideration of the Free Energy Principle in

A Conceptual Consideration of the Free Energy Principle in Cognitive Maps: How Cognitive Maps Help Reduce Surprise

2024-02-26
1