大家好,我是轩辕。
最近有读者问我,面试被问到高性能,但因为自己都是靠死记硬背,没有消化理解,所以答的不是很好。
高性能涉及的东西有很多,该怎么才能记住呢?
我觉得这是一个很有代表性的问题,相信很多人都有类似的困惑,所以决定写篇文章来好好聊聊这个问题。
确实是这样,当初轩辕在准备高性能相关的面试问题时,也是同样的感受,有好多东西啊,该想个什么办法把它们都串起来呢?
计算机运行的本质,或者说程序执行的本质,就是CPU不断取出内存中的指令,然后执行它。
在这个过程中,CPU需要与内存打交道,因为程序指令在这里面;还需要与硬盘、网卡等一些外部设备打交道,存储数据、传输数据。
CPU、内存、外部设备,这三个是计算机最主要的三个东西,所以我们在思考高性能的问题时,围绕这三个东西,就可以把很多技术串起来。
1、让CPU执行指令更快一点
程序是CPU在执行,最容易想到的当然就是让CPU跑的更快一些。这方面主要是涉及硬件技术,跟软件关系不大。
比如提高CPU主频、指令流水线技术、乱序执行、分支预测等等。
2、使用缓存
程序运行经常需要读取和加载数据,当程序经常需要从一个慢速设备读取数据时,性能势必会受到影响。所以,可以先把数据缓存到一个能快速获取的地方,加快数据加载速度,然后选择适当的时机来更新缓存中的数据。
缓存技术在计算机中无处不在,CPU中有存放数据和指令的一二三级缓存,还有存放内存地址翻译的TLB缓存。
操作系统中的文件系统管理硬盘数据也使用了页缓存Page Cache。
后端服务为了快速获取数据,使用Redis/Memcache作为内存数据缓存,避免每次都从数据库中查询。
浏览器中为了加快渲染速度,也有前端资源的缓存,避免每次都找网站服务器请求。
网站服务器为了提高响应速度,也有CDN缓存。
3、减少CPU被打断次数
CPU在运行过程中不是一直埋头执行程序,它时不时的会被打断,这就是中断。
最典型的就是网络数据包处理,如果在很大网络流量下,网卡每来一个数据包都通过中断告诉CPU,那CPU一天别干活了,烦都要烦死了。
所以Linux内核中的NAPI技术通过轮询网卡,减少中断次数就能显著提高性能。
另外DMA技术通过把数据传输的工作外包出去,解放CPU,也是这一思想的应用。
4、减少内存拷贝
很多时候,程序需要频繁拷贝数据,但拷贝数据的过程时比较耗时的,如果能减少拷贝的次数,无疑会提高程序性能。
比如内存映射、零拷贝技术就属于这一类技术。
另外高性能抓包技术DPDK,让应用程序直接读取网卡,减少数据拷贝也是这种思想的体现。
5、并行与并发
这个思想很直接,一个人干活忙不过来,那就多找几个人一起干。并行与并发的思想同样在计算机领域无处不在。
如CPU的多核技术,超线程技术、单指令多数据技术SIMD等。
多线程技术、NUMA技术、多节点负载均衡技术等。
后端服务开发中的I/O多路复用技术(select/poll/epoll)。
6、减少锁的竞争
前面提到多线程技术,而提到多线程就离不开锁。很多时候,线程在锁的竞争上浪费了太多时间,上下文的切换这些都需要有开销。
所以减少锁的竞争也是提高性能的一种方式,这方面的技术有原子操作、无锁编程等。
7、资源池化技术
很多程序运行启动时就预先分配好资源,而不是在需要的时候才去分配,这也是一种提高性能的方法。最常见的有线程池、内存池。
8、减少I/O次数
程序运行的时候经常要从硬盘上读取数据,而这类操作是非常耗时的,如果能减少I/O的次数,合并I/O次数,对性能的提升将是巨大的。
体现这类思想的技术有B 树、SQL批量执行等。
9、良好的数据结构与算法
程序的灵魂是数据结构与算法,前面说了那么多,即便都做到了,但如果你的数据结构和算法设计的一塌糊涂那也是白搭。
良好的数据结构与算法能够从根本上解决高性能的问题。
这方面思想的体现有哈希表、B 树、跳表等。
总结
上面这几个点不是孤立存在的,很多时候都是互相交织在一起的综合应用。比如零拷贝技术,既是减少内存拷贝的思想,也是减少打扰CPU的思想。在I/O多路复用epoll中,既是并发思想体现,也有减少内存拷贝思想的体现。
最后来总结一下,下次回答提高性能可以从四个增加、四个减少、一个良好来展开:
增加CPU速度、增加缓存、增加并行度、增加资源池
减少内存拷贝、减少I/O次数、减少CPU被打断次数、减少锁竞争
良好的数据结构与算法
高性能是一个广泛的话题,这篇文章也不可能涵盖所有,如果有遗漏的欢迎大家评论区补充交流。