【问题表现】
项目的登录接口在压测过程中从1000并发提高3000并发,QPS没有任何变化。
图1:1000并发,31.57k QPS
图2:3000并发,31.52k QPS
【问题分析与排查思路】
分析思路:
先定位是哪个链路出了问题。
然后根据波形图特征进行合理的推测。(一开始可能很懵逼,阅图无数后会有一些感觉)
1. 因为经常会被业务方挑战是压测机的问题,所以就想先加一个集群来压测,以确认是压测机的问题,还是压测链路的问题,亦或是业务方的问题。
压测结果:两个集群,各1500并发,QPS值总共6k
2. 从上面的现象可以分析出,压测链路具备6WQPS的并发能力,一定是压测机某方面的资源受到限制。
3.受到该同学的启发,我去看了下压测机的压测机的外网出带宽,果然都被打满(上限是50M)
【总结】
在压测的过程中,我们不仅要关注服务端的负载能力,也要需要关注压测机的负载能力,尤其是是CPU,内存和带宽三个指标。