DevOps 这个名词是在2008年年末流行起来的,截止到本书写作时(2016年初),这个单词的具体意义仍在不断改变中。这个名词的核心思想是尽早将 IT 相关技术与产品设计和开发过程结合起来,着重强调自动化而不是人工操作,以及利用软件工程手段执行运维任务等。这些思想与许多 SRE 的核心思想和实践经验相符合。我们可以认为DevOps是SRE核心理念的普适版,可以用于更广范围内的组织结构、管理结构和人员安排。同时,SRE是 DevOps 模型在 Google的具体实践,带有一些特别的扩展。
虽然每个SRE团队都有自己的工作流程、优先级定义以及日常工作规范,但是所有的SRE团队都有一套共同的核心方法论。一般来说,SRE 团队要承担以下几类职责∶可用性改进,延迟优化,性能优化,效率优化,变更管理,监控,紧急事务处理以及容量规划与管理。SRE管理层针对这些内容制定了一套完整的沟通准则和行事规范,这些规范规定了SRE是如何操作Google生产环境的,也规定了SRE如何和产品研发部门、测试部门、最终用户进行有效沟通。这些准则和规范能够帮助每一个 SRE 部门保持良好的研发和运维工作的平衡。
下面这几小节具体描述了 Google SRE的几个核心方法论。
|