SLO与SLA服务级别协议的关系
最后,SLA 是服务质量协议(Agreement)∶指服务与用户之间的一个明确的,或者不明确的协议,描述了在达到或者没有达到SLO之后的后果。这些后果可以是财务方面的——退款或者罚款——也可能是其他类型的。区别SLO和SLA的一个简单方法是问"如果SLO没有达到时,有什么后果?"如果没有定义明确的后果,那么我们就肯定是在讨论一个SLO,而不是 SLA。SRE通常不会参与 SLA的书写,因为 SLA是与业务产品的决策紧密相关的。但是,SRE确实会参与帮助避免触发 SLA中的惩罚性条款。同时,SRE会参与制定具体的SLI∶很明显,提供一个客观的方式来度量 SLO 是很重要的,否则大家就会产生分歧。
Google搜索服务是没有公开 SLA的一个典型服务∶我们当然希望所有人都能够最方便、最快地使用Google的搜索服务,但是我们并没有与全世界签订合同。但是,即使如此,如果搜索服务不可用依然有后果产生——对Google形象有损害,同时也会使得 业务收入下降。很多其他的 Google服务,例如 Google for Work,具有明确的用户SLA。不管某个服务是否具有SLA,定义SLI与SLO,并且用它们来管理服务质量都是很有价值的。
理论说了这么多,终于可以开始讲一些实践经验了。
既然我们已经详细描述了为什么选择合适的指标度量服务质量是很重要的,那么究竟如何来识别哪些指标对服务是最重要的呢?
页:
[1]