你冗灾了吗? 转自:ITValue
1. 为何需要冗灾?
公司历经了4年的信息化建设,业务对IT系统的依赖性越来越大,需要一个冗灾中心来避免IT系统对业务的影响。
2. 如何建设冗灾?
从IT的预算以及冗灾中心的实际应用考虑,将冗灾中心建设成为灾备中心是一个可行的方式,即冗灾中心除了在紧急情况下提供冗灾服务外,日常可以作为IT的备用中心,将开发、测试系统全部迁移到冗灾中心,并为主生产中心的SAN提供实时的备份。
正式由于上述的方案,冗灾中心建设完成后,为主生产中心腾出了约5个机柜的空间,同时开发、测试服务器放在冗灾中心,也减少了为冗灾所准备的额外的硬件开销,成本效益还是不错的。
3. 关于冗灾演练?
演练的目的除了验证系统的可靠外,也要求业务部门建立相应的BCP方案,通过演练,教育业务部门DR不是IT部专属职责,业务部门是要自己准备的。
4. 关于冗灾系统实施的几点教训?
供应商的素质:虽然是国内知名的供应商实施,但供应商对系统的掌握程度以及在国内的应用经验明显不足,针对不同的硬件和网络环境,供应商只能做到基本配置。由此导致了三次对生产环境的直接影响,比较的杯具。作为甲方,只能通过事故发现供应商在配置方面的不足。
系统的选择方面,同构和异构各有优缺点,需要根据企业的实际情况进行选择,模块选择方面,大部分供应商都无法对所实施的系统进行精确选择,甲方需要多加注意。
精彩评论:
•何雪峰:
演练要常规化、正规化。特别要重视人员更迭频繁的岗位和部门。
避免真正灾难到来时,冗灾和应急方案被忘记。
以前某公司应急方案做的比较到位,但缺乏有效演练、常规化和正规化,出现事故时,没人记得有应急方案,一线岗位一片茫然。
黄颖俊:
我们在项目过程中建立了一个冗灾演练系统,目的是把个部门的冗灾文档进行收集,并将每次演练的过程和文档集中在系统中进行统一管理。当然该系统是安装在冗灾中心的。
IT的事情一定得用系统来支持哈!
周华胜:
多少人还记得今年3月日本知名的瑞穗银行大规模长时间的IT系统故障事件?谁应该为这类事件负责? 日本瑞穗银行行长因系统故障引咎辞职提供了一个直接的范例。
|