从 0 到 1 带你搞定系统稳定性
理解 SRE 的正确姿势
10+ SRE 必学必会知识点
可落地的故障应急处理机制
2 种典型 SRE 组织架构案例分享
这个课程分为基础篇和实践篇两大模块。
- 基础篇:带你从实践的角度理解 SRE 是什么,并以 SRE 的基本概念 SLO 和 SLI 作为切入点,教你一步步建立起 SRE 稳定性标准。最后结合具体的电商案例,分享在实际场景中设定稳定性目标应该考虑的因素。
- 实践篇:围绕“故障”这个影响稳定性的核心事件,分享故障发现、故障处理、故障复盘三个阶段的最佳实践。同时,着眼落地 SRE 时绕不开的组织架构问题,分享真实的组织架构设置实践和高效的跨团队协作经验。
〖课程截图〗:
├──jk48201-SRE实战手册
| ├──00丨开篇词 (1讲)
| | ├──00丨开篇词|SRE是解决系统稳定性问题的灵丹妙药吗?.html 5.09M
| | ├──00丨开篇词|SRE是解决系统稳定性问题的灵丹妙药吗?.pdf 3.59M
| | └──00丨开篇词丨SRE是解决系统稳定性问题的灵丹妙药吗?.m4a 7.67M
| ├──01丨基础篇 (5讲)
| | ├──01丨SRE迷思:无所不能的角色?还是运维的升级?.html 8.98M
| | ├──01丨SRE迷思:无所不能的角色?还是运维的升级?.m4a 7.90M
| | ├──01丨SRE迷思:无所不能的角色?还是运维的升级?.pdf 6.20M
| | ├──02丨系统可用性:没有故障,系统就一定是稳定的吗?.html 4.14M
| | ├──02丨系统可用性:没有故障,系统就一定是稳定的吗?.m4a 8.64M
| | ├──02丨系统可用性:没有故障,系统就一定是稳定的吗?.pdf 2.65M
| | ├──03丨SRE切入点:选择SLI,设定SLO.html 4.44M
| | ├──03丨SRE切入点:选择SLI,设定SLO.m4a 11.81M
| | ├──03丨SRE切入点:选择SLI,设定SLO.pdf 2.85M
| | ├──04丨错误预算:达成稳定性目标的共识机制.html 5.75M
| | ├──04丨错误预算:达成稳定性目标的共识机制.m4a 12.99M
| | ├──04丨错误预算:达成稳定性目标的共识机制.pdf 4.01M
| | ├──05丨案例:落地SLO时还需要考虑哪些因素?.html 3.93M
| | ├──05丨案例:落地SLO时还需要考虑哪些因素?.m4a 10.31M
| | └──05丨案例:落地SLO时还需要考虑哪些因素?.pdf 2.50M
| ├──02丨实践篇 (5讲)
| | ├──06丨故障发现:如何建设On-Call机制?.html 4.61M
| | ├──06丨故障发现:如何建设On-Call机制?.m4a 11.42M
| | ├──06丨故障发现:如何建设On-Call机制?.pdf 2.93M
| | ├──07|故障处理:一切以恢复业务为最高优先级.html 2.76M
| | ├──07|故障处理:一切以恢复业务为最高优先级.m4a 11.50M
| | ├──07|故障处理:一切以恢复业务为最高优先级.pdf 1.55M
| | ├──08丨故障复盘:黄金三问与判定三原则.html 3.27M
| | ├──08丨故障复盘:黄金三问与判定三原则.m4a 8.02M
| | ├──08丨故障复盘:黄金三问与判定三原则.pdf 1.86M
| | ├──09丨案例:互联网典型的SRE组织架构是怎样的?.html 6.20M
| | ├──09丨案例:互联网典型的SRE组织架构是怎样的?.m4a 9.20M
| | ├──09丨案例:互联网典型的SRE组织架构是怎样的?.pdf 3.78M
| | ├──10丨经验:都有哪些高效的SRE组织协作机制?.html 2.17M
| | ├──10丨经验:都有哪些高效的SRE组织协作机制?.m4a 9.44M
| | └──10丨经验:都有哪些高效的SRE组织协作机制?.pdf 1.33M
| └──03丨结束语 (1讲)
| | ├──结束语|聊聊我的SRE落地心路历程.html 1.78M
| | ├──结束语|聊聊我的SRE落地心路历程.m4a 4.57M
| | └──结束语|聊聊我的SRE落地心路历程.pdf 1.27M
评论0