云计算SLA：如何保障正常服务时间

Solo 发表于 2011-5-24 10:52:32

学习资料： ITIL培训基地专家讲堂直播 300期视频回放

云计算SLA：如何保障正常服务时间

【TechTarget中国原创】当前，考虑到云计算和大型主机时代之间的相似性（对远程资源的高度依赖），云计算服务级别协议（SLA）已经势在必行。

　　在经历了22年前伊利诺斯州贝尔公司转接站的那场大火之后，Raymond Gloor很自然地成为了一名数据安全专家。当时的火灾导致了数十万人通讯的中断，损坏了该州Hinsdale与其他50个转接中心的光纤通路。“我们从未遇到过一个站点的损坏就导致了这么严重的后果。”Gloor回忆说。下面这段话节选自1988年5月Hinsdale那场大火之后纽约时报的评论文章：

　　由于线路不仅承载话音还负责传输计算机数据，其对国民经济的重要性日益凸显，所以电话系统的脆弱性是一个急需解决的问题。企业日常都用电话线路传输订单、资金和相关信息。电话服务的故障将会极大影响经济的运转，从而导致数以百万计美元的商业损失。

　　“把这篇文章的标题改成《万维网》，同样的内容也一样适用。”Gloor说。而且现在网络上有大量的视频内容，这将会导致反应速度的变慢。而对于某些行业来说，这种延迟是令人无法接受的。

　　“你不能对银行客户说‘我们不知道你的户头上有多少钱’。”Gloor描述说。由于政府关于银行业新法规的出台，如何应对延迟问题变得非常重要。“这不是一只800磅的猩猩。”他说：“这只猩猩是怪兽级别的。”

　　伊利诺斯转接站的教训极其深刻，也同时决定了Gloor对于云服务提供商的立场：“业务连续性是如此重要，尤其是对于那些考虑把应用移入云端的CIO们来说更是如此。Web连接发生故障的后果是什么？如何通过云SLA来解决这种问题？”

　　Ken Harris是Shaklee Corp.（位于加州）的CIO，而且也是Gap Inc.、耐克公司和百事公司的前任CIO。他同意Gloor的观点：“作为CIO，我有责任确保所负责的系统可用性在99.999%以上。但是坦率地说，以我对SaaS的切身体验而言，很多云提供商没有真正认识到这一点。”

　　灾难规划人员认为所有能想象到的事情都会在某个时间点发生。在云服务故障时应该怎么做呢？Harris认为很关键的一点就是用云SLA来确保正常服务时间、响应时间以及系统的及时恢复。

　　云计算SLA保障正常服务时间

　　除去各种不可抗力的因素，Harris认为真正危险的是SaaS服务提供商没有理解CIO们对于正常服务时间的需求：“一个坏损的、无法发挥作用的系统对我们来说是不可接受的。”

　　Harris就这些相关问题和PivotLink公司（位于加州旧金山的一家按需商业智能服务提供商）进行了直接沟通。Harris的雇主Shaklee是一家天然营养品公司，其每年都要进行数百项的科学研究，从而会产生大量的数据。在正式购买PivotLink的服务之前，Harris先确认了该公司满足下列要求：

[*]响应时间。“我必须对响应时间负责，必须达到要求，否则无法合作。”Shaklee公司通过一些简单的交易事务测试了PivotLink服务的响应时间。
[*]故障时间。如果系统故障，提供商应该通过自身力量确保服务恢复。
[*]灾难恢复。仔细核查合同中的相关内容。你应该有一个容灾的恢复站点，可以是企业本地的。
[*]正常服务时间的奖励。Shaklee为PivotLink提供了针对正常服务时间的经济激励。“这在每份SaaS的合同中都应该有所体现。”Harris表示。

　　总之，通过互联网提供的服务难免遇到故障，但是这并不意味着就束手无策了，CIO们可以和云提供商进行协商以应对最坏情况的发生 – 而且，要以书面形式加以规定。

koky55 发表于 2011-5-25 01:57:09

.....虽然也在云计算部门，但是还真没看懂呵呵~~！学习了~！

页: [1]

艾拓先锋社区's Archiver

云计算SLA：如何保障正常服务时间