网御星云防火墙CPU使用率100%解决方案
前几天收到河南某地方性银行出现的故障:网御星云防火墙CPU使用率一直处于100%的状态, 于是前去现场检查设备 发现 1.该防火墙策略做的并不多; 2.该防火墙当前的出入端口流量也并不大; 可以排除防火墙的工作负载过大导致CPU满载。
3.查看日志也只能获取CPU使用率100%的信息
回想在出现故障开始到现场检查的这段时间,收到过几次现场工程师发来的几张截图,在重新翻看记录的时候发现
这两张图在不同的时间 显示内存也一直保持在58%,心想这是不是性能显示的这程序有故障, 于是咨询网御原厂的一朋友,了解到部分设备出现过此问题,
代码语言:javascript复制 由于设备长时间运行 cpu时间过长 导致变量溢出、cpu利用率计算错误、持续保持100%,解决此BUG,需要打补丁。
找到故障原因开始制定实施解决方案:
制定方案:
当前环境是两台设备做的是HA,所以先升级备机,再升级主机
1.初始操作: a) 备份:保存并导出配置。 b) 关闭HA功能。
2.升级备墙: c) 将备墙断电关机,并拔掉业务线和心跳线。 d) 将备墙开机,电脑直连备墙,升级补丁包 e) 重启备墙,将心跳线接回,并开启HA功能,待HA状态同步后,将业务线接回。
3.升级主墙: a) 主墙设备断电,备墙此时切换为新的主墙,验证新的主墙用户业务是否正常。若用户业务不正常,需切回原来的主墙。 b) 将原来的主墙心跳线、业务线依次拔掉,并关闭HA功能,电脑直连主墙,打上升级包,并重启。 c) 将心跳线、业务线依次接回原来的主墙,并开启HA功能,状态变为备墙
4、验证 在HA状态下查看系统面板状态、系统状态及业务是否正常。
5、退回方案 升级补丁不能逆操作,若业务连通性有故障可将导出的配置重新导入。
晚上12点做变更,升级备机之后就可以看到CPU仪表盘恢复正常了