银行业灾备体系建设面临的挑战及对策
出处:中国金融电脑银行信息系统的安全运行是金融业稳定运行和长远发展的基础,并关系到国民经济发展和社会稳定,做好灾难备份体系建设是银行业信息安全的重要保障和关键环节。
银行信息系统的安全运行是金融业稳定运行和长远发展的基础,并关系到国民经济发展和社会稳定,做好灾难备份体系建设是银行业信息安全的重要保障和关键环节。当前,金融业务量的大幅提升、IT应用环境日趋复杂及银行业国际化多元化的发展,给中国银行业的灾备体系建设带了诸多挑战。如何建设符合业务发展需要的灾备体系应对上述挑战,已成为银行业信息科技工作的重头戏。近日,本刊 采访了国家开发银行信息科技局局长洪正华。采访中,洪正华分析了当前银行业灾备体系建设面临的挑战,提出了应对挑战的具体策略,并详细介绍了开发银行灾备体系建设情况及技术特色。
:灾备体系建设对我国银行业来说具有哪些重要意义?
洪正华:银行作为重要的金融机构,关系民生,承担着非常重要的社会责任。温家宝总理在第四次全国金融工作会议上指出,要加强金融机构网络信息安全,以科技的手段促进金融服务与管理创新,提高金融信息化水平,确保信息安全。2011年12月银监会发布《商业银行业务连续性监管指引》(以下简称《监管指引》),明确了银行业灾备体系建设管理的相关要求。
对于银行业来说, 灾备体系建设的重要意义在于:一是保障各项业务正常开展,在发生灾难时,恢复信息系统支持业务办理;二是提升银行IT服务水平和业务持续运行能力;三是满足国家和监管机构合规性要求,提高银行市场竞争力,提升银行品牌形象。此外,灾备体系建设是银行IT发展战略的重要内容和信息安全的重要组成部分,是银行业务可持续运行的重要保障。
:银行业灾备体系建设面临哪些挑战?如何应对?
洪正华: 随着银行业务的快速发展,信息系统更新换代频率高,也要求灾备系统随之改变,对灾备体系建设提出挑战。应对策略主要包括以下几个方面:加强生产系统和灾备系统的协同管理、保障灾备环境高可用;建立有效的应急响应体系,有效汇总及传达突发信息,为应急决策提供依据,提高应急响应反应能力;整合数量庞大且结构松散的应急预案,实现紧急情况下的问题的准确快速定位,提高应急管理流程及预案的可操作性;建立有效的演练体系,提高预案和演练的紧密程度,形成演练的长效机制,通过演练检验预案的有效性。上述灾备体系建设管理中的每一项任务,都需要银行风险管理部门和科技管理部门的持续投入,需要业务部门的配合,需要全行上下共同努力。
:请介绍下开发银行灾备体系建设情况。
洪正华: 开发银行发展战略对业务连续性保障建设提出了如下总体要求,即建立安全可靠的灾难备份中心,实现开发银行的信息系统运行保障场地、重要信息和处理系统的灾难备份,提高开发银行信息系统的风险抵御能力,避免或减少灾难事件和重大事故造成的损失,确保核心业务系统的数据安全和业务经营的连续性,避免引起重要服务功能和渠道的严重中断,有效维护国家金融稳定安全和客户利益。
在实现了全行的数据大集中后,为了避免数据大集中带来的风险,满足业务连续性的要求,开发银行2006年开始了灾备系统建设,进行了生产中心风险分析以及灾备中心选址工作,对现有生产系统进行了业务影响分析,并据此制定灾难恢复策略和灾难恢复预案等。
在灾备中心建设上,开发银行严格按照灾备中心选址要求,在2006年选择北京亦庄作为同城灾备中心,深圳观澜作为异地灾备中心,与总行生产中心一起,形成了“两地三中心”模式的灾难备份体系。2007年10月,同城和异地灾备中心建成,并投入使用,此后根据生产系统变更情况,不断完善灾备中心系统建设,2010年进行了同城和异地灾备中心系统补全实施,2011年开始建设北京怀柔同城灾备中心,新灾备中心建成后,将把同城亦庄灾备中心迁移到怀柔,目前各项工作正在有条不紊的进行当中。
:开发银行灾备体系建设应用了哪些关键技术?
洪正华:灾备系统建设是项庞大的系统工程,涉及面广,技术难度大,建设周期长。开发银行在灾备系统建设的实践中,围绕“两地三中心”的总体要求,积极有序推进,在大胆采用先进技术手段的同时,辅以建立配套的管理制度流程和业务连续性计划,灾备体系建设达到国内先进水平。
开发银行灾备系统采用高可靠性、与平台无关的磁盘阵列数据复制技术,通过可靠的高速通信线路在灾备中心保留重要的业务数据备份,做到同城灾备系统数据的零丢失。灾难备份中心配置相应的主机系统及外围设备,并建立到达业务网点的备份通信网络。一旦灾难发生,通过网络切换,灾难备份中心将接替数据中心运行,保障业务持续运行。
由于目前灾备中心采用主备模式,多数情况下IT设备处于闲置状态。平时这些设备可以用于测试环境或者准生产环境,提高了设备使用率。此外,采用虚拟化技术,将灾备中心的服务器配置成多台虚拟机,分给不同的用户所使用,充分地使用硬件资源,也降低了灾备中心设备的能耗。
:开发银行如何通过灾备体系来进一步提高突发事件应急响应能力和处理能力?
洪正华:建立有效的应急响应体系,是应对突发事件的重要手段。在此基础上,为了提升突发事件响应能力,开发银行进行了多项常规和专项工作。
一方面,定期进行业务连续性(BC)管理工作,通过专业的业务影响分析(BIA)、风险分析(RA),充分了解生产中心系统存在的风险隐患,并制定相应的灾难恢复策略。另一方面,对现有灾难恢复预案进行细化完善,制定不同场景下的应急响应预案;定期进行灾备系统的子系统验证和综合演练工作,包括技术层面和业务层面,并结合桌面模拟演练和Call Tree演练,验证灾备体系的可用性和有效性。
此外,开发银行还定期进行应急预案的修订和更新,并进行相关培训和意识教育,使工作人员了解各自的岗位职责、应急响应及灾难恢复流程,提升应急处置的综合能力。
:开发银行的灾备体系如何确保业务连续性?
洪正华: 在业务连续性管理方面,开发银行遵照银监会《监管指引》,以风险管理局牵头组织业务连续性管理体系建设,科技局负责IT相关业务连续性建设工作,持续改进业务连续性和灾备体系建设工作。
一是,不断完善同城和异地灾备中心基础设施建设,加强灾备系统运维管理,保障灾备系统和生产系统同步运行。
二是,将业务连续性管理提高到银行战略发展高度,加强管理层面的操作流程梳理,包括危机预测、危机管理、应急管理以及制定业务连续性计划。
三是,加强灾备组织体系、人员、基础设施等关键资源管理,健全各项灾备管理制度和流程,营造业务连续性管理企业文化。
四是,循序渐进推进业务连续性建设,建立流程化、体系化、平台化的业务连续性管理框架,并通过专业培训、桌面演练等多种形式不断加强和改进业务连续性管理。
:开发银行的数据中心和灾备中心建设中采取了哪些节能措施?
洪正华:数据中心和灾备中心机房是用电大户,能耗主要集中在用电方面,数据中心和灾备中心建设中的节能措施也主要围绕节省用电、有效降低PUE值(数据中心全部用电/IT设备用电)来进行,具体来说从IT设备用电、机房空调用电和照明等辅助用电三大方面采取相关措施来节能。
一是,IT设备用电的节能主要在于提高用电效率、降低UPS等供电设备损耗,主要措施是优化UPS设备选型。一方面,选用安全可用系数较高的UPS产品,在满足IT设备用电的同时,降低了UPS的冗余功率配置,既提高UPS的运行效率也降低了UPS能耗,同时还节省了采购费用;另一方面,选用效率系数较高的UPS产品,以降低UPS本身的运行耗电。
二是,在机房空调节能方面,主要的节能措施在于优化机房内的气流组织,采用分冷热通道的高密度机柜布局方式,充分利用机房精密空调的制冷量,提高空调运行效率,达到节省空调制冷用电的目的,同时还大幅度提高了机房面积的利用率,容纳同样的IT设备占用较少的机房面积,也意味着可以节省机房建设用地和建筑规模,同样具有节能降耗的意义。
三是,机房照明等辅助用电虽然只在数据中心用电中占很小的比例,但也采取了分段分区照明控制、选用节能灯具等节能措施,做到节能从点滴做起,聚沙成塔、集腋成裘,建设真正的绿色数据中心。 {:soso_e100:}
页:
[1]