简介
之前笔者有连续 2 篇文章:
•Prometheus 性能调优 - 什么是高基数问题以及如何解决?[1]•如何精简 Prometheus 的指标和存储占用[2]
陆续介绍了一些 Prometheus 的性能调优技巧,包括高基数问题的解决以及精简 Prometheus 的指标和存储占用。
今天再介绍一个新的调优思路:水平分片。
水平分片
如果你正在面临的不是因为 label 导致的高基数问题,而是因为监控规模的急剧扩张导致需要被监控的 instance 非常庞大时,可以通过 Prometheus 的hashmod
relabel action 来优化性能。通过这种办法,面对成千上万的 instance 时,一台 Prometheus 只需要监控其中的所有各种各样实例的一部分 instance。