×

扫描二维码登录本站

标签: 暂无标签
叮当201509259月22日,在西雅图举行的2015中美经济ITIL培训基地上,中国智能手机领导厂商小米公司宣布,在以国内兄弟公司的智能云平台为首要供应商之外,也将开始采用基于微软技术由世纪互联运营的Windows Azure公有云作为“小米云服务”的云存储平台。微软智能云平台将通过“小米云服务”为小米手机用户提供安全、可靠、不间断的云端信息同步备份与存储服务。同时, 微软智能云平台遍布全球24个区域的超大规模运营优势,也将有助于加速小米手机进军更为广阔的国际市场。随着小米智能家居等物联网设备及业务的不断发展,未来微软智能云平台还将在数据的存储、分析和应用方面为小米提供支持。云应用微软公司资深副总裁、微软大中华区董事长兼首席执行官贺乐赋(Ralph Haupter)表示:“微软与小米公司的合作,是微软智能云平台在中国市场上取得的重要进展。作为首个、也是目前唯一在中国正式商用的国际公有云,我们很高兴能充分发挥微软智能云平台在技术创新、可靠运行、数据安全等方面的优势,服务亿万小米手机用户。通过与小米公司的合作,我们希望能为更多用户打造一流的移动互联网体验,同时以微软智能云平台全球部署的优势,助推以小米为代表的中国企业走向世界。”小米公司联合创始人、副总裁黄江吉表示:“作为一家创新型科技企业,小米公司的视野正从智能手机拓展到包括互联网电视、智能家居的整个生态链。专注于应用层的云服务,对于小米而言,是非常重要的战略。随着小米用户量、数据的爆炸式增长,以及与日俱增的对云平台的需求,在中国大陆地区,我们以兄弟公司的智能云平台为首要提供商进行业务拓展,同时寻求与优秀的国内外云平台进行合作。这次,从‘小米云服务’出发,着力建设先进、安全、可靠、高性价比的ITSS云计算平台,以云端的数据存储、分析和应用为基础,完善小米生态系统,为全球用户打造更加智能、美好的新生活。而微软智能云平台是我们在云上发展的理想选择。”
AWS上周末崩溃5小时 故障原因大揭秘

对于亚马逊而言,9月20日是个糟糕的一天。美国东海岸亚马逊网络服务(AWS)出了故障,5小时后才恢复。本文聊一下故障原因以及AWS恢复服务的过程。AWS还好不是在周一(9月21日)上午挂掉的,否则网友们少不了吐糟。AWS是周日(9月20日)挂的,周日凌晨太平洋夏令时间3点(北京时间周日下午6点)挂了,几乎没有人注意到。云产品当然,如果你是诸如亚马逊视频和Reddit的一些流行用户服务和网站的系统管理员的话,你当然会知道这事。有没有被搞了个措手不及?在AWS的大客户里,似乎只有Netflix公司对AWS数据中心出现大故障做了二手准备,其他人似乎都没有准备。要知道,这次的故障远非一个“简单的”数据中心问题,并不是诸如美东AWS主干互联网叫推土机不小心碰了一下那么简单,这次的故障要复杂得多。云主机一开始是亚马逊在美国弗吉尼亚的DynamoDB服务出问题。DynamoDB是一种快速灵活的NoSQL数据库服务。DynamoDB用于支持应用程序,必须保证在支持大规模的程序时延迟在几毫秒以内。你可能已经猜到了,许多时间敏感度高的AWS云服务都用到 DynamoDB服务。一位AWS发言人在对此事作出正式回应时表示,“2015年9月20日太平洋夏令时间凌晨02时13分到早上7点10分,美国东部地区的亚马逊DynamoDB服务的读写操作出现错误率非常大的情况,影响了该地区的其他AWS服务,并造成一些AWS客户也受到错误率增大的影响。“云存储DynamoDB一旦出现读/写问题,其性能就会开始崩溃,进而会影响美国东部的其他AWS服务。出现这种情况后,美国东部所有其他AWS服务的应用程序编程接口(API)开始出现超时。尔后,基于AWS的服务就开始失效。有些客户受到的影响比其他客户大些。在大多数情况下,这些客户会受到错误增多的影响,导致客户无法访问自己的网站和服务。许多这一类的网站其实并没有“挂掉”,但网站的性能下降,无法提供满意的服务。

根据周日的AWS服务运行状况仪表板上DynamoDB条目的数据,整个故障过程如下:凌晨3:00 (所有时间为太平洋夏令时间,缩写为PDT):我们正在检查美国-东-1区API请求错误率升高的问题。凌晨3:26 PDT:美国-东-1区所有DynamoDB API调用误差率继续增加,我们正在全力解决此问题。凌晨04时05 PDT:已经找到了问题的根源,我们正在努力恢复服务。Saas凌晨04时41分PDT:我们仍在解决美国-EAST-1区错误率升高的问题,以求恢复DynamoDB API的正常工作。凌晨04时52分PDT:我们在下面为大家提供目前情况的详细信息。问题的根源是DynamoDB内部的部分元数据服务。它是一个内部子服务,作用是管理表和分区信息。我们的恢复工作重点目前放在恢复元数据操作上。在我们进行恢复工作期间,API的速度将受到限制。可以看到,亚马逊花了两个小时才找到问题的根源。他们接着就降低了所有AWS API的速度,以便其间他们的ITIL系统管理员解决出现的问题。Paas早上5:22 PDT:我们现在开始对API信息安全管理 限速,以利恢复工作的进行。早上05:42 PDT:元数据服务开始趋向稳定;我们仍在继续恢复工作,力求尽快取消API限速。早上6:19 PDT:元数据服务现在稳定了下来,我们的恢复工作的目标是尽快取消API限速。早上07:12 PDT:我们仍在努力恢复服务,力求尽早取消API限速及恢复正常API,但会遵循小心谨慎的原则。早上07:22 PDT:我们已开始逐步取消API限速,恢复正常流量。早上7:40 PDT:我们继续取消API限速,可望在短期内恢复正常。早上7:50 PDT:读写操作开始恢复正常,我们在继续努力恢复其他各种操作。早上8:16 PDT:读写操作的恢复进展非常顺利,我们仍在继续努力恢复其他各种操作。至此,AWS用了5个多小时才重新恢复正常服务。ITIL

从理论上说,7月16日发布的亚马逊DynamoDB可能有助于缓解该问题,原因是该版本含DynamoDB跨区域复制功能。其客户端解决方案使得AWS客户可以在不同的AWS地区内同时保存相同的DynamoDB表副本,而且是近乎实时的。使用该功能当然是要交钱的,但有了这个功能以后,你就可以利用跨区域复制功能备份DynamoDB表,或是可以对分布在不同地理位置上的数据进行低延迟访问。不管怎么说,此次事件表明,即便是全球最大的云服务提供商也会发生重大故障。有些业务要求绝对无中断,那么,在DynamoDB跨区域复制上花点钱则会是明智的一步。







上一篇:企业信息安全策略越大越好?
下一篇:信息安全管理合集——《信息安全技术 信息安全风险管理指南》(GBZ 24364-2009)
沙拉

写了 310 篇文章,拥有财富 1645,被 3 人关注

您需要登录后才可以回帖 登录 | 立即注册
B Color Link Quote Code Smilies

成为第一个吐槽的人

Powered by ITIL  © 2001-2025
返回顶部