最新 最热

TACO-LLM发布!助力大模型极致加速

TACO-LLM 是基于腾讯云异构计算产品推出的一款大语言模型推理加速引擎,用于提高语言模型的推理效能。通过充分利用计算资源的并行计算能力,TACO-LLM能够同时处理更多的语言模型推理请求,已成功为客户提供了兼顾高吞吐和...

2023-11-17
0

用LLM生成反驳:首先洞察审稿人的心理,再巧妙回应!

在科研领域,同行评审(review-rebuttal)是保证学术质量的关键环节。这一过程中的辩论和反驳非常具有挑战性。传统的同行评审生成任务通常集中在表面层面的推理。 研究人员发现,考虑论点背后的态度根源和主题可以提高反驳...

2023-11-16
0

大模型落地的必经之路 | GPTQ加速LLM落地,让Transformer量化落地不再困难

来自Transformer家族的预训练生成模型,通常被称为GPT或OPT,已经在复杂语言建模任务中取得了突破性的性能,引起了广泛的学术和实际兴趣。它们的一个主要障碍是计算和存储成本,这些成本在已知模型中排名最高。例如,性能最好...

2023-11-15
1

大模型落地的必经之路 | GPTQ加速LLM落地,让Transformer量化落地不再困难

来自Transformer家族的预训练生成模型,通常被称为GPT或OPT,已经在复杂语言建模任务中取得了突破性的性能,引起了广泛的学术和实际兴趣。它们的一个主要障碍是计算和存储成本,这些成本在已知模型中排名最高。例如,性能最好...

2023-11-15
1

【每日精选时刻】工作十六年,我是从什么时候感觉到编程能力突飞猛进;一文带你解密LLM;面试官:“只会用自增主键?回去等通知吧”

大家吼,我是你们的朋友煎饼狗子——喜欢在社区发掘有趣的作品和作者。【每日精选时刻】是我为大家精心打造的栏目,在这里,你可以看到煎饼为你携回的来自社区各领域的新鲜出彩作品。点此一键订阅【每日精选时刻】专栏,吃瓜...

2023-11-15
1

解密Prompt系列19. LLM Agent之数据分析领域的应用:Data-Copilot & InsightPilot

在之前的 LLM Agent+DB 的章节我们已经谈论过如何使用大模型接入数据库并获取数据,这一章我们聊聊大模型代理在数据分析领域的应用。数据分析主要是指在获取数据之后的数据清洗,数据处理,数据建模,数据洞察和数据可视化的...

2023-11-15
1

终结扩散模型,IGN单步生成逼真图像!UC伯克利谷歌革新LLM,美剧成灵感来源

当前,生成式AI模型,比如GAN、扩散模型或一致性模型,通过将输入映射到对应目标数据分布的输出,来生成图像。

2023-11-14
0

谷歌DeepMind爆火动画18秒解释LLM原理,网友蒙圈!组团求GPT-4下场分析

Google DeepMind最近在自己的视频博客上上传了一段视频,「简单明了地」演示了大语言模型的工作原理,引发了网友的激烈讨论。

2023-11-14
0

全新近似注意力机制HyperAttention:对长上下文友好、LLM推理提速50%

Transformer 已经成功应用于自然语言处理、计算机视觉和时间序列预测等领域的各种学习任务。虽然取得了成功,但这些模型仍面临着严重的可扩展性限制,原因是对其注意力层的精确计算导致了二次(在序列长度上)运行时和内存复...

2023-11-14
0

魔搭社区LLM模型部署实践, 以ChatGLM3为例(二)

魔搭社区和Xinference合作, 提供了模型GGML的部署方式, 以ChatGLM3为例。

2023-11-12
0