SRE 工作职责金字塔
传统行业运维模式• 系统管理员 (Sysadmin)
• 将现成的组件组装、部署为服务
• 响应事件与更新
• 随着服务规模增长,团队规模也随之扩张
• 优势
• 劣势
• Ben Treynor Sloss
• 资深研发负责人
• 2003 年加入 Google 组建 7人“生产运维小组”
• 由软件工程师执行运维工作
• 从内心里鄙视重复性工作
• 有能力进行自动化研发
• 用自动化软件完成运维工作
• SRE 是 DevOps 思想在运维方面的具体实践
SRE 工作职责金字塔
• 应急响应
• 监控
• 应急事务处理
• 事后总结
• 日常运维
• 变更管理
• 容量规划与置备
• 性能与效率
SRE 工作职责金字塔顶层 —— 工程研发
• 制定合理的 SLO
• 在 SLO 安全范围内全速前进
• 可靠性是软件的核心功能
页:
[1]