运用CA Xosoft,确保业务可持续性 冠群电脑(中国)有限公司 技术顾问:董剑波
董剑波负责CA产品的售前,CA作为技术产品和解决方案的提供商,有相关BCM的产品来帮助企业业务系统实现可持续性。本次演讲主要包括如下几部分:CAEITM解决方案一览、如何确保业务连续性、成功案例分享和问题讨论。
一、 C CA EITM解决方案一览
成立于1976年,总部位于美国纽约长岛,年营业额30多亿,是排名全球第四的IT管理软件公司,99%的全球财富500强企业都是CA的客户。CA专注于业务服务优化,产品包括企业系统及网络管理、安全管理及存储管理。
CA的发展目标是符合COBIT标准,提供企业相关IT全方位管理解决方案,力求减少企业IT运营风险,提高投资回报率。CA业务涵盖的范围包括IT治理、IT管理和IT安全三部分,我们的愿景是帮助企业更好的在这三个方面实现绩效优化。
CA恢复管理的解决方案包括分析、安全、政策、加密、备份、媒体危机管理和设备管理等,并提供一个统一的架构来支撑这些功能,在统一的平台上提供相应解决方案。
二、如何确保业务连续性
下面我们可以用一个案例来介绍确保业务连续性的方法。一个零售业的巨头FutureS在追赶Wal-Mart的迅速发展过程中,忽然SCM系统瘫痪,导致业务中断。CIO由于无法及时应对而被辞退。由于供应链管理系统宕机一分钟将损失近11,000美元,CEO开启紧急会议,任命了新的CIOFish进行业务连续性管理规划。Fish在进行BCM时需要按照四个步骤进行:制定草案明确如何更好的执行BCM,培训相关人员了解BCM的思想和运作方式,进行应急预言核查草案执行力,根据演练结果评估优化草案。
下面介绍BCM要考虑的两个重要指标:RTO和RPO。
RTO是恢复时间目标,是指灾难发生后从IT系统停机导致业务停顿开始,到IT系统恢复可以支持业务恢复运营之时,所需要的时间。不同企业对RTO的要求不同,零售行业的目标最高,最多容忍10分钟的系统瘫痪时间,否则损失不可估计。
RPO是恢复点目标,是指能够恢复至可以支持业务运作,系统及数据恢复到怎样的更新程度,可以是上一周的备份数据,也可以是上一次交易的实时数据。我们的目标是通过BCM的规划将中断业务恢复到一个最新的状态,发生意外灾难事件时可能丢失的数据量最小。
业务连续性保护技术解决方案包括基于应用程序的容灾解决方案、基于数据库的容灾解决方案、基于主机系统的容灾解决方案和基于存储的容灾解决方案。案例中Fish采用的是基于主机系统的容灾解决方案,可以确保持续数据保护(ContinuousData Protection - CDP)、应用程序的应用感知能力(包括MS SQL, MS Exchange, Oracle,& MS IIS)、备份数据100%的可用能力。
业务连续性保护过程中面临的挑战是底层平台和存储设备众多时,如何跨平台实施BCM方案。Fish决定采用WANSync进行实时的数据复制,从旧金山的主站点实时复制应用程序、文件和数据到纽约站点,复制过程中可以实现底层平台的完全透明化。当旧金山主站点出现问题时,备用站点服务器会有实时监控功能,监控到主站点出现问题后,在几分钟的衔接时间后,纽约站点就会接管旧金山服务的功能,这就是WANSyncHA最强大的附加自动切换功能。进行数据转移的方法有很多,这对于用户都是透明的。所以BCM的核心功能体现在远程系统的及时监控和侦测,确保第一时间识别问题,及时解决。另外,WANSync特设多对一的复制策略可以节省硬件资源,物理节点到虚拟机的复制策略可以节省软件资源。
下面介绍一个很重要的功能,数据还原Rewind技术。Rewind可以实现将每一条记录实时备份到备份服务器上,并在出现错误时实现回滚,提取存储在回滚区的正确数据。因此,即使用户的错误数据写入,也可以回滚到之前的正确状态。这是xsoft的另一种核心能力,恢复到任意时间点(CDP)。
接下来重点介绍一下Assured Recovery工作机制。AssuredRecovery可以定时自动帮用户进行恢复演练,确保复制过来的数据完全可用有效,没有任何问题。整个过程不用人干预,自动实现,这种应用在业界屈指可数,很好的符合了用户的审核需求。
综上所述,CA业务连续性解决的方案优势在于平台和存储设备无关性(广泛支持各种应用和平台,囊括主流厂商的产品)、简单安装部署、灵活的复制策略(字节级复制、带宽的调节)、数据回滚(确保可以恢复到最近的完好数据)、自动地灾难测试(确保复制数据的完整性)。
三、案例分享
CA的BCM系统解决方案的典型案例主要有香港证券交易所、亚洲网通和华泰证券,下面重点介绍前两个。
香港证券交易所,日交易量6000到7000万,自2003年起,已采用WANSync系统,是香港最大规模的WANSync用户(到目前为止,共70多台)。香港证券交易所的应用属于同城业务保护,可以实现对多种关键系统的保护,包括MicrosoftExchange Servers、Microsoft SQL Servers和File Servers,他采用了WANSyncHA 及Assured Recovery系列技术产品。
亚洲网通的案例实现的是日本MS Exchange系统容灾保护,采用T1连接东京及香港的数据中心,属于跨城保护。该应用配合2Mbps带宽,200用户,30 G数据,每日作复完保证(AssuredRecovery)测试和自动灾难恢复测试,并在备机上作出备份。
Q&A
1.您主要提到的是操作系统方面的系统保护解决方案,在ERP应用软件领域,如SAP等有没有相应的数据恢复和程序恢复的举措?
ER领域的应用同样可以通过刚才讲解的WANSync系统来实现,只是它不直接包含内嵌模板,需要通过加载一个软件向导,实现相应保护。加载的模板不在列表内,只是因为他不是最典型的应用,但是我们完全可以根据客户需求进行相应的定制服务。
2.这个方案和Oracle的自带备份系统有什么区别?
CA解决方案和Oracle的自带备份系统都可以做实时和分时的数据复制,但是覆盖范围不同,CA可以支持分布式应用和跨平台应用,很多企业的业务保护需要在多平台上进行。
此外,我们还提供额外的管理功能,如AssuredRecovery的灾难恢复预演功能是Oracle的功能中不具备的。此外,自动灾难恢复功能和回滚功能在应用性、灵活性方面都比数据库自带的功能要强大很多。
3.CA进行备份保护的方式是怎样的?
在操作系统级别将数据实时复制到备份系统中。
4.刚才的介绍可以看出对于文件复制的方案,但是对于数据库的复制是怎样进行的?
数据库方面我们有集成性的特点,和许多厂商的API有集成,一般用快捷复制,直接和数据库底层集成,从而确保数据一致性和集成性。
5.实时复制会对当前系统的应用有影响,使用户访问数据变慢,贵公司的产品在这方面的性能如何?是否提供硬件解决方案?网络中断时如何解决?
CA可以在复制内容很大的时候进行压缩,并且提供缓存区,在本地暂时存储相应内容,减缓速度压力。另外,我们提供的是软件解决方案,在硬件方面会有相应的推荐,即什么样的硬件配置能使我们的软件功能发挥到最佳。当然数据的复制备份一定要有网络的配合,应该通过多种手段确保网络的稳定性。
6.备份和恢复中预演功能的实现是怎样的?
刚才介绍过一个软件的功能是AssuredRecovery测试,并在备机上做出备份,实现自动灾难恢复测试预演,从而直接实现选择相应数据进行实时监测。
|