最新 最热

把LLM视作操作系统,它就拥有了无限「虚拟」上下文,伯克利新作已揽1.7k star

近年来,大语言模型(LLM)及其底层的 transformer 架构已经成为了对话式 AI 的基石,并催生了广泛的消费级和企业应用程序。尽管有了长足的进步,但 LLM 使用的固定长度的上下文窗口极大地限制了对长对话或长文档推理的适用性...

2023-10-24
1

别再「浪费」GPU了,FlashAttention重磅升级,实现长文本推理速度8倍提升

最近,像 ChatGPT 或 Llama 这样的大型语言模型(LLM)引起了前所未有的关注。然而,它们的运行成本仍然极高。虽然生成单个响应可能仅需 0.01 美元(在 AWS 上的 8xA100 实例上运行几秒钟),但当扩大规模以满足数十亿用户的需求时...

2023-10-24
1

C# Intern Pool

驻留池(Intern Pool)是一个用于存储字符串的内部数据结构。这个概念是由.NET提供的一项优化,主要用于减少系统对内存的使用。

2023-10-24
1

Semantic Kernel .NET SDK 的 v1.0.0 Beta1 发布

Semantic Kernel (SK) 是一个开源的将大型语言模型(LLM)与流行的编程语言相结合的SDK,Microsoft将Semantic Kernel(简称SK)称为轻量级SDK,结合了OpenAI,Azure OpenAI和Hugging Face等AI LLM的集成。它使开发人员能够通过编排 A...

2023-10-24
1

CPU飙升怎么办?

解决这个问题的关键是要找到Java代码的位置。下面分享一下排查思路,以CentOS为例,总结为4步。

2023-10-24
1

盘点MySQL慢查询的12个原因

日常开发中,我们经常会遇到数据库慢查询。那么导致数据慢查询都有哪些常见的原因呢?今天田螺哥就跟大家聊聊导致MySQL慢查询的12个常见原因,以及对应的解决方法。...

2023-10-24
1

LLM推理速度飙升23倍!Continuous Batching:解锁LLM潜力!

LLMs 在现实应用中的计算成本主要由服务成本所主导,但是传统的批处理策略存在低效性。在这篇文章中,我们将告诉你,为什么 Continuous Batching 连续批处理成为了解决这一问题的新方法,而不再把 LLMs 视为“黑匣子”。这个...

2023-10-24
1

被忽略的缓存 -bfcache

bfcache(Back-Forward Cache)是浏览器的一种机制,在 Safari 和 Chrome 中都得到了很好的支持 (笔者在测试最新的 Firefox 发现已经禁用了 bfcache),它利用内存缓存来存储用户访问过的页面状态。当用户在浏览器中执行后退...

2023-10-24
1

MySQL:共享系统内存下的InnoDB引擎优化策略

在面对系统资源有限的场景下,优化数据库的性能是每个开发和运维团队的共同任务。特别是在应用程序和数据库共享相同系统资源的情况下,高效的资源利用不仅能保证系统的稳定运行,还能提升应用的响应速度。本文将集中讨论如...

2023-10-23
1

mysql: 8.0参数优化

MySQL 8.0在内存管理和性能优化方面做了很多改进,而innodb_buffer_pool_size参数仍然是一个关键的参数,它可以显著影响数据库的性能。然而,除了innodb_buffer_pool_size之外,还有其他一些参数也可以用来优化MySQL的性能和...

2023-10-23
1