掌握大厂50万节点监控系统架构设计策略,探索Prometheus底层源码,深入理解构建高效监控系统的核心原理。让你成为监控领域的顶级专家,轻松应对大规模系统的性能挑战!

简介:

《大厂50万节点监控系统架构设计&Prometheus底层源码级剖析》这门课程适合运维工程师、软件架构师、研发工程师以及其他资深IT人士学习。通过这门课程,你能够掌握大规模监控系统的设计原理和实现方法,深入了解Prometheus监控系统的底层源码和工作机制,提高你在监控领域的技术水平和解决问题的能力。无论你是希望提升自身技能的IT工程师,还是希望提高团队能力的资深技术人员,这门课程都将为你提供有价值的参考和启示。

章节目录:

万级节点的Prometheus搭建

7小节

8:44:17

1.1 prometheus简介主流时序监控对比

01:07:18

1.2 ansible-playbook安装node_exporter安装grafana

51:38

1.3 prometheus采集node_exporter和target说明

01:19:51

1.4 grafana使用简介

01:29:06

1.5 prometheus数据结构和promql使用说明

01:31:59

1.6 黑盒探针和单进程监控和mysql监控

01:09:19

1.7 多实例采集说明和day01总结

01:15:06

监控采集端原理、pushgateway⾼可⽤实战、动态分⽚采集问题实战

7小节

7:51:53

2.1 k8s中的prometheus环境搭建及讲解

01:50:18

2.2 pushgateway打点实验和基于文件的服务发现模式

01:30:34

2.3 服务树介绍

43:48

2.4 consul使用和watch服务

51:43

2.5 一致性哈希算法原理和python实现

45:42

2.6 采集端动态采集分片方案

01:03:08

2.7 动态分片实现pushgateway高可用方案

01:06:40

Prometheus存储原理、远端分⽚存储⽅案实战

4小节

7:02:32

3.1 dod+xor压缩算法+lsm数据结构

01:32:39

3.2 mmap+倒排索引+prometheus本地存储原理

01:43:23

3.3 m3db简介安装测试+m3db问题总结

02:02:05

3.4 基于采集器本地数据的multi_remote_read+方向代理存储方案

01:44:25

监控报警端原理、微信&钉钉告警回调/配置实战

6小节

7:24:04

4.1 盘点告警系统的功能点

01:18:00

4.2 告警原理和alertmanager分组配置

01:36:58

4.3 alertmanager抑制和静默配置

38:20

4.4 gossip协议原理和alertmanager高可用及企业微信配置

01:18:54

4.5 实用告警promql举例和告警回调重启服务

01:55:31

4.6 总结

36:21

监控查询端原理、⾼基数查询问题实战

6小节

7:33:12

5.1 grafana分角色使用注意点

01:20:31

5.2 prometheus数据查询接口

58:01

5.3 prometheus管理和统计接口

40:38

5.4 query_log和range_query原理

01:25:22

5.5 预聚合解决方案

01:41:41

5.6 总结

01:26:59

国内顶级⼤⼚Devops岗位⾯试经验分享

5小节

6:24:25

6.1 监控对接运维平台

01:41:52

6.2 日志方案loki简介

01:02:23

6.3 prometheus监控系统总结01

35:32

6.4 prometheus监控系统总结02

23:53

6.5 面试指导&岗位分析

02:40:45

历史上的今天
06月
15
    抱歉,历史上的今天作者很懒,什么都没写!
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。