[已解决]大数据集群CPU告警问题解决

2023-10-31 08:27:39 浏览数 (1)

大数据集群CPU告警问题解决

问题

6台机器的 CPU总是连续超过90%

思路

调整yarn资源

常见的是调整容器虚拟 CPU 内核

yarn.nodemanager.resource.cpu-vcores

根据集群具体的CPU核数规划

我另外调整了两个参数

最小容器虚拟 CPU 内核数量

yarn.scheduler.minimum-allocation-vcores

设置为2

原本是1,这样能减少并行的任务数

最大容器虚拟 CPU 内核数量

yarn.scheduler.maximum-allocation-vcores

设置为7

防止CPU超频告警

解决

目前集群稳定运行无告警!

0 人点赞