LLM_字节宝

港大等发布GraphGPT：1/50微调参数，准确率提升10倍！无需超长token，LLM也能读懂图结构

图神经网络（Graph Neural Networks）已经成为分析和学习图结构数据的强大框架，推动了社交网络分析、推荐系统和生物网络分析等多个领域的进步。

token 模型数据性能 LLM

2023-10-29

ChatIE（LLM大模型用于信息抽取）

利用ChatGPT实现零样本信息抽取（Information Extraction，IE），看到零样本就能大概明白这篇文章将以ChatGPT作为一个基座然后补全前后端，来实现抽取任务。主要针对抽取中的三个重要任务：...

后端模型设计事件 LLM

2023-10-28

清华微软「LLM+推理智能体」超越GPT-4！攻克数理难题，斩获开源界MATH最佳成绩

清华大学，微软研究院共同发表了一篇论文，创造性地提出了TORA：在LLM之外使用推理智能体，结合自然语言分布推理，就能大幅提高研究LLM的数理能力和推理能力。...

开源 gpt math 模型 LLM

2023-10-28

那些年踩过的坑！大型语言模型（LLM） Fine-Tuning 经验之谈...（干货）

由于 ChatGPT 和 GPT4 兴起，如何让人人都用上这种大模型，是目前 AI 领域最活跃的事情。当下开源的 LLM（Large language model）非常多，可谓是百模大战。面对诸多开源本地模型，根据自己的需求，选择适合自己的基座模型和参数量...

量化模型内存数据 LLM

2023-10-27

EMNLP2023 && 北大 | 当大模型（LLMs）遇到新知识，还能给出正确答案吗？

在这个不断变化的世界，当大型语言模型（LLM）遇到新知识还能给出正确答案吗？如何评估LLM应对新知识的能力呢？

测试模型设计数据 LLM

2023-10-27

LLM一句话瞬间生成3D世界，未公布代码已获141星！或将引发3D建模行业革命

场景效果和文字的要求几乎分毫不差——「平静如玻璃的湖面，倒映出无云的天空，周围的山和水鸟的倒影呈现在湖中。」

代理函数行业 3D建模 LLM

2023-10-26

LeCun又双叒唱衰自回归LLM：GPT-4的推理能力非常有限，有两篇论文为证

「任何认为自动回归式 LLM 已经接近人类水平的 AI，或者仅仅需要扩大规模就能达到人类水平的人，都必须读一读这个。AR-LLM 的推理和规划能力非常有限，要解决这个问题，并不是把它们变大、用更多数据进行训练就能解决的。」...

gpt 论文模型性能 LLM

2023-10-26

【周末瞎想】LLM应该如何落地？

除了做LLM本身的技术，如何将LLM结合具体行业、结合具体产品进行落地，是很多公司在探索的。

翻译行业统计研发 LLM

2023-10-26

LeCun和xAI联创对呛，GPT-4重大推理缺陷无解？网友：人类也是「随机鹦鹉」

最近，包括LeCun在内的一众大佬又开始针对LLM开炮了。最新的突破口是，LLM完全没有推理能力！

gpt 论文模型网络 LLM

2023-10-25

GPT-4教会机器手转笔、玩魔方！RL社区震惊：LLM设计奖励竟能超越人类？

英伟达、宾大、加州理工、德州奥斯汀等机构的专家提出一个开放式Agent——Eureka，它是一个开放式Agent，为超人类水平的机器人灵巧性设计了奖励功能。...

机器人 gpt 函数设计 LLM

2023-10-25

17 18 19 20 21

港大等发布GraphGPT：1/50微调参数，准确率提升10倍！无需超长token，LLM也能读懂图结构

ChatIE（LLM大模型用于信息抽取）

清华微软「LLM+推理智能体」超越GPT-4！攻克数理难题，斩获开源界MATH最佳成绩

那些年踩过的坑！大型语言模型（LLM） Fine-Tuning 经验之谈...（干货）

EMNLP2023 && 北大 | 当大模型（LLMs）遇到新知识，还能给出正确答案吗？

LLM一句话瞬间生成3D世界，未公布代码已获141星！或将引发3D建模行业革命

LeCun又双叒唱衰自回归LLM：GPT-4的推理能力非常有限，有两篇论文为证

【周末瞎想】LLM应该如何落地？

LeCun和xAI联创对呛，GPT-4重大推理缺陷无解？网友：人类也是「随机鹦鹉」

GPT-4教会机器手转笔、玩魔方！RL社区震惊：LLM设计奖励竟能超越人类？

热门文章

热门手册