您的位置:首页 > 娱乐 > 八卦 > 上市公司排行榜_天津进口网站建设电话_安卓优化大师2021_百度商城官网首页

上市公司排行榜_天津进口网站建设电话_安卓优化大师2021_百度商城官网首页

2025/2/25 5:10:36 来源:https://blog.csdn.net/weixin_48502062/article/details/143083291  浏览:    关键词:上市公司排行榜_天津进口网站建设电话_安卓优化大师2021_百度商城官网首页
上市公司排行榜_天津进口网站建设电话_安卓优化大师2021_百度商城官网首页

本节重点介绍 :

  • 采集器单点问题和危害
  • 采集器挂掉的场景原因
  • 静态分片的手段和弊端

采集器单点问题

  • 采集器由于prometheus进程挂了,导致数据断点
  • 数据断点时间取决于 进程挂的持续时间
  • 采集器上的所有job数据都将断点

模拟数据断点问题

  • 将prometheus采集器停止 1分钟
  • 断点图片image.png

prometheus进程挂的常见原因

  • 由于采集target的突增,导致prometheus采集器内存暴涨,oom
    • 动态服务发现举例,k8s中的pod扩容,导致数据暴涨,prometheus,oom
    • 静态配置突增的原因
    • image.png
  • 由于prometheus所在机器 down机导致

危害

  • 采集器宕机时,看图不可用
  • 报警不可用,因为查询不到数据

静态分片的手段

应用:hashmod 解决k8s大集群采集问题

场景说明

  • 有的k8s集群数据量太大了,一个prometheus采集会导致内存消耗过多,采集效率下降
  • 此时需要启动多个prometheus,使用hashmod做静态分片
  • hashmod需要和keep或drop做配合

配置说明

  • 第1个prometheus配置
relabel_configs:- source_labels: [__address__]regex: (.*)modulus: 2target_label: __tmp_hashreplacement: $1action: hashmod- source_labels: [__tmp_hash]regex: ^0$replacement: $1action: keep
  • 第2个prometheus配置
relabel_configs:- source_labels: [__address__]regex: (.*)modulus: 2target_label: __tmp_hashreplacement: $1action: hashmod- source_labels: [__tmp_hash]regex: ^1$replacement: $1action: keep
  • 解读一下,两个prometheus的 modulus=2代表一共两个分片
  • 其中第1个 regex: ^0$ 第二个 regex: ^1$ ,然后通过action: keep做保留
  • 意思是target的__address__做hash之后对2取模
  • =0由第1个prometheus采集,=1由第2个prometheus采集

源码解读

	case HashMod:mod := sum64(md5.Sum([]byte(val))) % cfg.Moduluslb.Set(cfg.TargetLabel, fmt.Sprintf("%d", mod))

静态分片的弊端

  • 静态分片虽然将全部数据分成n份采集
  • 这时1个分片挂掉,只会影响 1/n的数据
  • 但是由于没有接管这 1/n,也会导致部分数据断点

本节重点总结:

  • 采集器单点问题和危害
  • 采集器挂掉的场景原因
  • 静态分片的手段和弊端

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com