背景
基本信息:
客户名称:腾讯欢乐斗地主
行业:IT服务/软件 游戏行业
涉及产品:腾讯云 Prometheus 监控服务、Grafana 可视化服务、容器服务
Prometheus 监控实践
注2:对于一些需要更多 label 的业务场景,业务也可以上报,只是使用另外的接口,metric 名也可以自定义。
2)使用一个全局 servicemonitor 来作为抓取任务。
3)直接通过 Grafana 页面手工维护 Dashboard。
4)对于指标查看,一个统一查看 Dashboard + 一些专属查看 Dashboard。
5)对于指标监控,一个统一监控 Dashboard + 一些专属监控 Dashboard。
Prometheus 真香定律
2)顺序写盘 + 合并写入:提高磁盘吞吐。
3)SSD:提高 IO 性能。
4)索引:提高读性能,可以有多级索引、倒排索引。
5)mmap:使用操作系统自己的内存管理。
6)有序化处理:方便做交集、查找、索引。
7)压缩:降低磁盘空间开销。
8)备份:提高可用性。
9)sharding:提高伸缩性。
10)WAL:write ahead log,辅助内存数据的可靠落地、延迟落地。
2.3 为什么选择腾讯云 Prometheus 监控服务
Prometheus 踩坑经验之谈
2)使用 Grafana 做 Dashboard,对上千取值的 label 做 repeated panel,查看对应项出现卡顿。
3)误用 url 作为 label,而 url 中包含了可变参数,导致高基数。
总结
相关产品介绍