P40
重点四:SRE的未来是遥远而光明的
当我们努力关闭今年的报告时,我们将供应作为最后一个数据点,而各公司则重新评估如何继续使用业务。我们问:“自从在家中,您多久进行一次灾难恢复场景?”当您考虑到您的各种恢复时间在中断的事态中可能会受到怎样的影响时,请考虑在您致力于恢复并实施可观察到的方法时采取的预防座右铭之路。系统。
可观察性就是能够回答“为什么我们的客户的体验是这样?”是因为第三方,应用程序代码,传输网络还是其他交付链组件(例如DNS或CDN)?然后使用这些答案来反复改进现有或新产品或服务。
在“内置”可靠性时,请在开发SRE章程时考虑开发与运行的之间的区别。这里的目标是尽可能早地包含可靠性,因为对于已经可靠的系统的改进可靠性来说要容易得多。
最后,请考虑您的员工队伍的分散性,并承认以前可能被忽略或不存在的一系列挑战。辛苦,缺乏支持,工作/生活平衡以及与世隔绝的感觉可能会导致某些剧本或流程从头开始重新评估。
自“在家”起,您多久进行一次灾难恢复场景?
决不
还没;我们是规划
随机地
每月一次
每周
其他
-----
当我们努力完成今年的报告时,我们提供了最后一个数据点,而公司则重新评估他们将如何继续业务。 我们问:“你在家多久进行一次灾难恢复?” 当您考虑在发生中断时如何影响您的各种恢复时间时,请在设计和实现可观察系统时考虑前面的预防格言路径。
可观察性就是能够回答,“为什么我们的客户的体验是这样的?”是因为第三方、应用程序代码、传输网络还是其他交付链组件,如DNS或CDN? 然后使用这些答案迭代改进现有的或新的产品或服务。
当“建立”可靠性时,在开发SRE宪章时,考虑开发与运维工作之间的区别。 这里的目标是尽早包括可靠性,因为提高可靠的系统的可靠性要容易得多。
最后,考虑一下你的劳动力的分布性质,并承认一些以前可能忽略的挑战不存在。诸如辛劳、缺乏支持、工作/生活平衡和孤独感等因素可能会导致某些剧本或过程被重新评估。
P41
重点四:SRE的未来是遥远而光明的
方法
2020年1月,Catchpoint通过电子邮件列表和社交媒体进行了SRE调查。该调查向各行各业的技术专业人员询问了他们的角色作为站点可靠性工程师的情况。通过报告,这组问题称为“预”问题集。
2020年6月,Catchpoint进行了一项附录调查,其中包括考量,用于与COVID 19在家待命相关的世界性事件。这组问题是
旨在提出各种“已更改的内容”问题,并称为“张贴”或“在家”问题集。
在撰写报告时,共有594名调查受访者。在格式化报告和编写附录之间的时间里,还出现了其他响应,但是它们仅使该报告中的统计信息受到的影响不到1%。
-----
方法
2020年1月,Catchpoint通过电子邮件列表和社交媒体进行了一次SRE调查。 这项调查询问了来自不同行业的技术专业人士,他们是一名现场可靠性工程师。通过报告,这套问题被称为“预先”问题。
2020年6月,Catchpoint公司进行了一项增编调查,包括对涉及《第19号公约》的广泛事件的审
议全职任务。 这套问题旨在提出各种“改变了什么”的问题,被称为“工作后”或“在家”的问题。
在编写本报告时,共有594名调查答复者。 在格式化报告和编写附录之间的时间里,还会有更多的答复,但它们只影响到本报告中的统计数据不到1%。
|