大数据集群CPU告警问题解决
问题
6台机器的 CPU总是连续超过90%
思路
调整yarn资源
常见的是调整容器虚拟 CPU 内核
yarn.nodemanager.resource.cpu-vcores
根据集群具体的CPU核数规划
我另外调整了两个参数
最小容器虚拟 CPU 内核数量
yarn.scheduler.minimum-allocation-vcores
设置为2
原本是1,这样能减少并行的任务数
最大容器虚拟 CPU 内核数量
yarn.scheduler.maximum-allocation-vcores
设置为7
防止CPU超频告警
解决
目前集群稳定运行无告警!