掌握大厂50万节点监控系统架构设计策略,探索Prometheus底层源码,深入理解构建高效监控系统的核心原理。让你成为监控领域的顶级专家,轻松应对大规模系统的性能挑战!
简介:
《大厂50万节点监控系统架构设计&Prometheus底层源码级剖析》这门课程适合运维工程师、软件架构师、研发工程师以及其他资深IT人士学习。通过这门课程,你能够掌握大规模监控系统的设计原理和实现方法,深入了解Prometheus监控系统的底层源码和工作机制,提高你在监控领域的技术水平和解决问题的能力。无论你是希望提升自身技能的IT工程师,还是希望提高团队能力的资深技术人员,这门课程都将为你提供有价值的参考和启示。
章节目录:
万级节点的Prometheus搭建
7小节
8:44:17
1.1 prometheus简介主流时序监控对比
01:07:18
1.2 ansible-playbook安装node_exporter安装grafana
51:38
1.3 prometheus采集node_exporter和target说明
01:19:51
1.4 grafana使用简介
01:29:06
1.5 prometheus数据结构和promql使用说明
01:31:59
1.6 黑盒探针和单进程监控和mysql监控
01:09:19
1.7 多实例采集说明和day01总结
01:15:06
监控采集端原理、pushgateway⾼可⽤实战、动态分⽚采集问题实战
7小节
7:51:53
2.1 k8s中的prometheus环境搭建及讲解
01:50:18
2.2 pushgateway打点实验和基于文件的服务发现模式
01:30:34
2.3 服务树介绍
43:48
2.4 consul使用和watch服务
51:43
2.5 一致性哈希算法原理和python实现
45:42
2.6 采集端动态采集分片方案
01:03:08
2.7 动态分片实现pushgateway高可用方案
01:06:40
Prometheus存储原理、远端分⽚存储⽅案实战
4小节
7:02:32
3.1 dod+xor压缩算法+lsm数据结构
01:32:39
3.2 mmap+倒排索引+prometheus本地存储原理
01:43:23
3.3 m3db简介安装测试+m3db问题总结
02:02:05
3.4 基于采集器本地数据的multi_remote_read+方向代理存储方案
01:44:25
监控报警端原理、微信&钉钉告警回调/配置实战
6小节
7:24:04
4.1 盘点告警系统的功能点
01:18:00
4.2 告警原理和alertmanager分组配置
01:36:58
4.3 alertmanager抑制和静默配置
38:20
4.4 gossip协议原理和alertmanager高可用及企业微信配置
01:18:54
4.5 实用告警promql举例和告警回调重启服务
01:55:31
4.6 总结
36:21
监控查询端原理、⾼基数查询问题实战
6小节
7:33:12
5.1 grafana分角色使用注意点
01:20:31
5.2 prometheus数据查询接口
58:01
5.3 prometheus管理和统计接口
40:38
5.4 query_log和range_query原理
01:25:22
5.5 预聚合解决方案
01:41:41
5.6 总结
01:26:59
国内顶级⼤⼚Devops岗位⾯试经验分享
5小节
6:24:25
6.1 监控对接运维平台
01:41:52
6.2 日志方案loki简介
01:02:23
6.3 prometheus监控系统总结01
35:32
6.4 prometheus监控系统总结02
23:53
6.5 面试指导&岗位分析
02:40:45
评论0+