admin 发表于 2020-11-21 14:14:24

去除谬见:对SRE的误解分析



近几年业界对 SRE 的关注越来越多,但是对于 SRE 的认知确实参差不齐,存在一些误区: 1、SRE 就是运维。只能说 SRE 包含与传统运维相近的因素,但SRE是一个综合型技能的岗位,需要很多方面的技能。 2、SRE 不需要懂业务。准确的说,没有一种工作是可以脱离业务而单独存在的,SRE要参与的技术与运维架构的优化与未来规划等,脱离业务是无法完成的。 SRE全称:Site Reliability Engineering,翻译:站点可靠性工程师。SRE的职责确保站点的可用,为了达到这个目的,他需要对站点涉及的系统、组件熟悉,需要关注生产运行时的状态。 q_70/images03/20201105/e5521632254b4ff69cab7017e1c2b175.jpeg 在谷歌定义 SRE的一些拥抱合理的风险、自动化、合理化、简单化等原则中,我们不难看出大型互联网企业对于 SRE 的渴求,薪资也是较高水平: q_70/images03/20201105/bdf333e4c01643dc9a229ce1d3955e19.png 11月27-28日,第十五届 GOPS 2020 全球运维大会将在上海盛大开幕! 在会前两天的 SRE(站点可靠性工程)Foundation 课程是对 SRE 原理和实践的介绍课程,使组织能够可靠且经济地扩展关键服务。引入SRE(站点可靠性工程)需要组织重新调整,关注工程和自动化并采用一系列新的工作范式。 该课程重点介绍了SRE的发展及其未来方向,并为参与者提供了实践,方法和工具,以使整个组织中的人们参与到可靠性和稳定性中,这些案例通过使用真实场景和案例来证明。完成课程后,学员将在回到公司后可以切实地利用诸如了解,设置和跟踪服务水平目标(SLO)的内容。 该课程使学习者能够成功完成 SRE Foundation 认证考试。
课程受众SRE Foundation 课程的目标受众是专业人员
任何对更高可靠性感兴趣的人任何对现代IT领导力和组织变革方法感兴趣的人SRE工程师业务经理
商业利益相关者顾问DevOps从业者IT主管
IT经理IT团队负责人产品负责人Scrum大师
软件工程师系统集成商工具提供者_
课程大纲 课程介绍 模块1:SRE原则和实践


[*]什么是站点可靠性工程?
[*]SRE和DevOps:有什么区别?
[*]SRE原则与惯例
模块2:服务水平目标和错误预算


[*]服务水平目标(SLO)
[*]错误预算
[*]错误预算政策
模块3:减轻苦工


[*]什么是苦工?
[*]为什么很辛苦?
模块4:监控和服务水平指示器


[*]服务水平指标(SLI)
[*]监控
[*]可观察性
模块5:SRE工具和自动化


[*]自动化定义
[*]自动化焦点
[*]自动化类型的层次结构
[*]安全自动化
[*]自动化工具
模块6:抗脆弱性和从失败中学习


[*]为什么要从失败中学习
[*]抗脆性的好处
[*]转移组织平衡
模块7:SRE的组织影响


[*]为什么组织采用SRE
[*]SRE采用的模式
[*]OnCall
[*]事后回顾与反思总结
[*]SRE和规模
模块8:SRE、其他框架


[*]SRE和其他框架
[*]未来
[*]其他信息来源
[*]考试准备
[*]考试要求,问题权重和术语表
[*]考试样题复习
课程目标 SRE Foundation 课程的学习目标包括对以下方面的实践与理解:


[*]SRE的历史及其在Google中的实践
[*]SRE与DevOps和其他流行框架的相互关系
[*]SRE背后的基本原则
[*]服务水平目标(SLO)及其用户关注点
[*]服务水平指标(SLI)和现代化的监控环境
[*]错误预算和相关的错误预算策略
[*]可观测性可以指示服务的运行状况
[*]SRE工具,自动化技术和安全性的重要性
[*]抗脆弱性,我们的失败和失败测试方法
[*]引入SRE带来的组织影响

页: [1]
查看完整版本: 去除谬见:对SRE的误解分析