FYIRH 发表于 2020-12-3 11:36:23

一个评估风险容忍度的例子∶前端基础设施

基础设施服务运维的关键战略就是明确划分服务水平,从而使客户在构建系统时能够进行正确的风险和成本权衡。通过明确划定的服务水平,基础设施提供者其实就是将服务的成本的一部分转移给了用户。以这种方式 成本可以促使客户选择既能够满足他们的需求又能够压缩成本的服务水平。例如,Google+将与保护用户隐私相关的数据放置在一个高可用、全球统一的数据存储中(例如,一个全球复制式的类似于 SQL 的系统,Spaner,参见文献 【corl2】),可选数据(不重要的但是能够增加用户体验的数据)放在一个价格更低、可靠性更低和最终一致的数据存储中(例如,Bigtable这种仅仅提供"尽力而为"模式的复制模式的 NoSQL 存储系统)。

这里要注意的是,我们可以使用相同的硬件和软件运行多个级别的服务。可以通过调整服务的各种特性提供不同的服务水平,如资源的数量、冗余程度、资源的地理配置,以及基础设施软件的配置。

为了解释上文中介绍的这些风险容忍度评估原则不仅仅适用于存储基础设施,我们再来看一下另一大类型的服务∶Google的前端基础设施。这个前端基础设施是由反向代理和运行临近我们网络边缘的负载均衡系统组成的。

这些系统的核心工作是负责直接处理用户连接(例如,接受用户浏览器发出的 TCP连接)。由于它们的关键性,这些系统需要具有超高的可靠性,面向消费者的服务通常可以用某种方式掩盖后端的不可用情况,但是这些基础服务一般没法这么做。如果某个请求没有到达应用服务的前端服务器,那么就意味着这个请求完全丢失了。

我们已经探讨了识别消费者服务和基础设施服务风险耐受能力的方法。现在,我们将继续讨论如何运用已知的风险耐受水平来通过错误预算调整系统的不可靠性。
页: [1]
查看完整版本: 一个评估风险容忍度的例子∶前端基础设施