大模型与AI底层技术揭秘 (11) 变形记

有一天，小H在吃完午饭回到办公室，旁边几位同学在打《王者荣耀》，并且在挑拨匹配到的一对情侣队友分手。

“你看你死了他才来救你，他心里一点都不在乎你！”

“你被人追着打的时候，他说不定是在和别的小姑娘打情骂俏呢！”

“他肯定是因为经常和别的女孩子一起玩，才和你配合不好的~”

“你好好问问他，他还有多少事情瞒着你？”

小H觉得这些人太不瑞雪，把他们赶到了会议室去玩，自己钻进睡袋。很快，小H闭上了眼睛。

小H睁开眼睛的时候，发现自己变成了一只甲虫……

当然，小H立即从噩梦中吓醒了。当小H揉着眼睛爬起来，才想起来这是奥地利作家Franz Kafka成名作《变形记》里面的情节。

Franz Kafka是奥地利著名作家，以高产而闻名。在《变形记》发表的96年后，他的迷弟Jay Kreps在Linkedin任职期间，和另外几个朋友开发了一种高性能的流式消息中间件，并以偶像的名字Kafka为之起名。

Kafka并不是今天的主角，但kafka采用的一种加速机制，却成为了高性能与AI计算软硬件体系中的基本操作——

这种机制叫做零拷贝。

在传统模式下，数据从网络和文件之间的传输需要经过4次拷贝，4次上下文切换和4次系统调用：

为了减少上下文切换以及数据拷贝带来的性能开销，Kafka使用了Linux系统调用mmap来处理其索引文件，将其映射到用户态进程可见的内存空间，从而实现快速访问和搜索内存中的索引，加速在日志文件中定位消息的过程。

mmap的具体机制是，将内核中读缓冲区（read buffer）的地址与用户空间的缓冲区（user buffer）进行映射，从而实现内核缓冲区与应用程序内存的共享，省去了将数据从内核读缓冲区（read buffer）拷贝到用户缓冲区（user buffer）的过程。也就是说，CPU只需要获取到读缓冲区的地址，就可以直接访问索引文件的数据了。