开发银行灾备系统建设的思考
出处:中国金融电脑IT的大集中也带来了系统风险的集中。作为银行业务连续运行的保障,灾备系统建设一直都是科技部门的重要工作。
近年来, 随着业务的高速发展,开发银行信息化建设的力度也越来越大,各类系统和数据逐步实现大集中,IT对业务的整体覆盖率达到84%。IT的大集中也带来了系统风险的集中。作为银行业务连续运行的保障,灾备系统建设一直都是科技部门的一项重要工作。开发银行十分重视这项工作,其灾备系统建设经历了数据异地备份、灾备系统外包和自建灾备中心等几个阶段。本文将对开发银行的灾备系统建设进行回顾和思考,并探讨了下一步的建设思路。 一、建设灾备系统的必要性
1.银行业务发展的需要
相关资料表明:金融行业在灾难停机两天内所受损失为日营业额的50%,如果在两个星期内未能恢复信息系统的正常运作,75%的公司将出现业务停顿,43%的公司可能再也无法开业,没有实施灾备系统措施的企业60%将在灾难后的2~3年间破产。由此可见,灾备和业务连续性建设直接关系银行生死存亡和可持续性发展的关键问题。
2.监管合规性的要求
一直以来,监管部门对银行信息科技风险管理给予了高度重视,近期也已连续发布了一系列的监管指引和要求。银监会下发的《商业银行数据中心监管指引》中明确要求:商业银行应于取得金融许可证后两年内,设立生产中心;生产中心设立后两年内,设立灾备中心;总资产规模一千亿元人民币以上且跨省设立分支机构的商业银行应设立异地灾备中心,灾难恢复等级达到《信息安全技术信息系统灾难恢复规范》中的第5级实时数据传输及完整设备支持。业务的发展和监管,都要求必须建立起完善的灾备体系和业务连续性保障体系。
uploadfile/2012/0618/20120618024232106.jpg
国家开发银行信息科技局局长 洪正华 二、灾备系统建设思路
如何建设灾备系统需要周密规划:除了要考虑技术实现外,还要考虑各类业务的不同需要;除了考虑资源投入外,还要考虑产出和利用;除了考虑通用的灾备模式,还要考虑自身的情况和能力。总之,没有所谓最好的灾备系统,只有最符合自身需要的灾备系统。
1.建设模式选择
目前,国内银行在进行灾备体系建设时一般有自建和外包两种模式,各有优缺点。自建是指银行独立建设数据中心,此模式具有较高的可靠性与安全性,但投入大、周期长,对银行技术人员的能力要求较高,适用于大型金融机构。外包是指由专业服务商在其数据中心内为银行提供数据与系统的灾备服务,此模式也能达到一定可靠性,投入小、周期快,对银行人员能力要求相对较低,适用于中小型金融机构。
2.灾备技术选择
计算机和通信技术的发展,特别是存储技术的发展,为灾备系统建设提供了多种可选的容灾技术,每种容灾技术都有自身的技术特点和应用局限性。目前应用比较多的
的技术包括以下几大类。
(1)基于存储的复制技术
国内常见的容灾解决方案,由存储厂家提供技术实现生产中心存储设备与灾备中心存储设备的直接镜像,将数据以同步或异步的方式复制到远端。其优点是将数据与应用分开,对主机系统的运行资源影响比较小,缺点是必须在本地端和灾备端分别配置两套相同的存储系统。
(2)基于主机的复制技术
通过安装在服务器的数据复制软件,实现异地数据复
制。该技术的优点在于成本相对较低且能兼容不同厂家的存储设备,缺点是会占用主机的资源。
(3)基于数据库的复制技术基于数据库的容灾技术传输的是数据库指令或者重作日志文件。该技术与存储类型和服务器平台无关,具有较好的使用灵活性。
3.根据系统分类选择灾备部署银行应用系统根据其处理的业务种类可分成以下几类。第一类(实时,客户服务)涉及账户、交易、支付和渠道的重要系统,也称银行核心系统,为客户直接提供服务。开发银行2007年就已实现同城和异地的灾备建设,每年灾备演练都会以核心系统作为主要的演练内容。第二类(准实时,员工服务)行政办公、财务、信贷、报表等管理类系统,支撑银行内部的日常运行。该类系统经过近几年的建设和完善,在同城灾备中心已经完成部署,部分关键系统还将考虑进行异地灾备部署。第三类(非实时):培训、档案、稽核、分析等系统,大部分已实现数据级备份,未来将考虑对其中的关键系统进行系统备份。
4 .业务连续性是灾备建设的关键
灾难备份和业务连续性的发展自20世纪70年代开始,经历了IT系统的灾备和恢复、业务恢复预案体系建立到9.11之后的业务连续性管理的提出和发展。2011年银监发【104】号《商业银行业务连续性监管指引》也对于银行业务连续性提出了严格和具体的要求。经过多年的建设和发展,开发银行也深刻感受到灾备系统的建设只是提供了技术的保障,能否取得预期的效果和保障业务的恢复,关键是业务连续性计划,需要领导的高度重视、相关业务部门的积极参与和掌握,要保障在灾难情况下,各个方面能各司其职、有效组织、高效协同地完成系统的恢复和业务的恢复。
灾难情况下,IT的恢复固然是非常重要的基础,但IT恢复以后,业务数据的完整性检查和交易补入、相关公关部门的有效沟通和协调、监管机构的报告和指导、行领导的决策和组织、各个业务部门和业务条线的有效业务恢复预案和相应的演练验证体系也同样重要。随着灾备建设的逐步完善和每年的演练,特别是桌面演练、流程演练等多项工作的开展和深入,开发银行更加深刻地感受到只有所有相关人员都能掌握相应的预案和流程,把灾备和业务连续性当做常态化工作,才能真正保障在灾难和系统严重故障时,整个业务连续性体系有效运作和快速恢复,保障开发银行对客户的服务持续有效。
三、开发银行灾备系统建设情况
开发银行以批发业务为主,客户数和交易量较少,但是单笔金额大,安全性要求高。从2005年开始,开发银行与人民银行清算中心无锡主站合作,采用外包方式建立
数据级的远程备份中心。2006年,银行业务发展和监管部门要求对开发银行灾备系统建设提出了迫切要求,在自身基础设施条件和技术力量不足的条件下,通过采购专业灾难恢复服务商的资源和服务,快速建立起开发银行的灾备体系,同时与专业服务商共同建设灾备系统的过程中,也培养和锻炼了自己的灾备团队。在建设灾备系统的过程中,开发银行遵循国际灾备组织的科学方法论,在风险分析、业务影响、灾备策略、技术方案、业务连续性等灾备建设的各环节,借力专业服务商的能力与经验,在较短的时间内快速、高效地完成开发银行灾备系统的建设工作。
根据开发银行的业务连续性总体规划要求,采用两地三中心架构建设生产中心、同城灾备中心(北京亦庄)和异地灾备中心(深圳观澜),分别应对不同类型的灾难模型。基于局部较小灾难性事件,可以切换至具有高指标、低成本、距离较近、切换方便的同城灾难备份中心;基于发生大范围、较严重的灾难性事件,总行的IT运行、业务系统和管理指挥体系受到破坏,则需启用远程异地灾难备份中心恢复运营。
在灾备建设过程中,对于关键技术的选择,开发银行对业界主流的容灾技术进行评估及衡量,最后采用较为成熟的基于高端智能存储系统的解决方案,实现同城灾备中心核心系统数据零丢失,灾备系统的切换快速、安全、可控。同时,考虑到外包灾备系统是一个的过渡性系统,基于风险分析、投入产出和技术实现等多方面权衡,决定采取“大同城、小异地”的灾备部署策略。
开发银行同城灾备中心及异地灾备中心于2007年10月正式上线运行,灾难备份等级达到了国际灾备标准第五级(TIER 5),率先实现了两地三中心架构。
四、建设思路
根据整体业务发展策略和集团化要求,开发银行计划逐步转向建立自己的,并以自主管理为主的数据中心和灾备体系。
开发银行已经开展了北京稻香湖新生产中心、北京怀柔同城灾备中心和西安浐灞异地数据中心的规划建设,并且将于2012年中完成怀柔同城灾备中心的建成投产,再加上总行现有的阜外和北丰生产中心,开发银行将形成一个两地多中心的高可靠的数据中心网络和体系,确保开发银行IT系统的高可用性和服务的连续性。
经过认真研究,开发银行将采用“大异地、小同城”的模式建立两地多中心的建设,并且考虑到业务特点, 逐步建立多中心双活的生产灾备体系,在同城建立必要的关键系统,保障一旦出现系统严重故障时的快速系统切换和恢复,在异地建立与生产中心等配的系统和设备,根据各个应用系统的特点和业务需求,与生
产中心形成主备模式、双活模式和负载均衡模式的多模式双活中心运行,如像数据库和核心业务采用主备模式运行,对于网上银行等能支持双活模式和负载均衡模式的系统采用双活模式运行。
同时,在灾备中心的规划建设中,还需考虑与开发、测试、验收等多种系统环境需求的结合,保障相应的投资和系统在提供高可用性保障能力的同时,合理充分利用系统设备资源,发挥更大的效益。
跟大家交流一个ITIL的概念吧:IT管理是在企业信息化运营过程中通过规范运维管理制度以及通过IT管理系统工具的支持,引导和辅助IT管理人员有效监控和管理各种IT资源,从而保证整个IT系统稳定、可靠和永续运行,为业务部门提供优质的IT服务,降低IT运营成本,提高业务部门对IT部门的满意度。业务策略与 IT 部门提供的服务之间的一致性是IT管理的首要目标。为确保可预测的 IT 服务交付,IT管理需要建立必要的管理机制,以及确保业务流程和IT流程之间的联系。IT管理从业者包括了CIO、CEO和部分IT和业务线执行人员。 啊啊啊啊啊啊啊啊啊啊啊 跟大家交流一个ITIL的概念吧:ITIL招聘是企业信息化部门或者IT服务提供机构为满足IT运维管理的需要,通过网络或者现场的方式进行ITIL人员的招聘。目前除传统上的机构互联网人才招聘网络,在ITIL培训基地等专业ITIL培训基地上也可以发布ITIL招聘,并可以在ITIL培训基地上实现人才的推荐和跟踪。
页:
[1]