工程工作(Engineering)是一种新颖的、本质上需要主观判断的工作。它是符合长期战略的,会对你的服务进行长久性的改善的工作。工程工作通常是有创新性和创造性的,着重通过设计来解决问题,解决方案越通用越好。工程工作有助于使该团队或是整个SRE 组织在维持同等人员配备的情况下接手更大或者更多的服务。
典型的SRE活动分为如下几类。
软件工程 编写或修改代码,以及所有其他相关的设计和文档工作。例如,编写自动化脚本,创造工具或框架,增加可扩展性和可靠性的服务功能,或修改基础设施代码以使其更稳健。
系统工程 配置生产系统、修改现存配置,或者用一种通过一次性工作产生持久的改进的方法来书写系统文档。例如,监控的部署和更新、负载均衡的配置、服务器配置、操作系统的参数调整和负载均衡器的部署。系统工程还包括与研发团队进行的架构、设计和生产环境方面的咨询工作。
琐事 与运维服务相关的重复性的、手工的劳动。
流程负担 与运维服务不直接相关的行政工作。例如招聘、人力资源书面工作、团队/公司会议、任务系统的定期清理工作、工作总结、同行评价和自我评价,以及培训课程等。
按全年或者数个季度来说,每个SRE需要花费至少50%的时间在工程工作中。琐事通常有一定集中性,对于某些团队而言,把50%的时间稳定地花在工程工作上可能不太现实,在某些季度中可能无法达到这个目标。但是,长期看来,如果工程时间的比例大幅低于50%,受影响的团队就需要退一步来找出问题所在。
|