• WAP手机版 RSS订阅 加入收藏  设为首页
期刊论文

中国疾控中心数据容灾系统的设计与实现

时间:2016/4/17 15:46:28  作者:his2000.com  来源:his2000.com  查看:0  评论:0
内容摘要:中国疾病预防控制中心(以下简称中国CDC)作为实施国家级疾病预防控制与公共卫生技术管理和服务的公益事业单位,是我国公共卫生体系的重要部分。2009年,中国CDC迁入新园区,涉及迁移20多个业务系统。根据中国CDC信息化建设总体设计要求,需要通过对现有网络、服务器、存储以及机房环境...

中国疾病预防控制中心(以下简称中国CDC)作为实施国家级疾病预防控制与公共卫生技术管理和服务的公益事业单位,是我国公共卫生体系的重要部分。2009年,中国CDC迁入新园区,涉及迁移20多个业务系统。根据中国CDC信息化建设总体设计要求,需要通过对现有网络、服务器、存储以及机房环境等IT基础设施的整合、升级和改造,建设中国CDC的同城异地灾备中心。


1  需求分析


目前CDC的业务工作对IT系统的依赖已达到非常高的程度,为完善IT系统保护机制,保证连续性工作的有效进行,需着重考虑规避以下可能的风险。


IT信息系统面临的风险分为三类:一是系统因素,包括计算机软硬设备故障、网络通讯故障等;二是人为因素,包括病毒传播与黑客攻击、人员操作失误或蓄意破坏、恐怖主义袭击等,目前超过70%的系统故障是人员误操作造成;三是环境因素,包括水灾、火灾、地震等自然灾害以及建筑物坍塌、社会动乱、战争等。


针对IT系统可能存在的风险,通过对IT系统过去主要停机事故的调研分析,得到其灾难类型分布比例,如图1所示。


中国疾控中心数据容灾系统的设计与实现
图1 IT系统主要灾难类型分布比例图


随着CDC工程建设的整体推进,CDC容灾中心不仅实现数据级容灾,还将实现应用级容灾。主要的技术目标如下:从生产数据中心到容灾备份中心的核心数据库容灾复制;灾难发生后,生产中心的主机停顿,关键业务切换到容灾中心,并提供对外服务;在无灾难发生时,容灾中心的主机能够承担对容灾数据的读取和查询,在业务峰值时容灾中心可以负载一部分查询压力;实现关键生产数据的异步复制,对数据中心生产系统的影响降到最小;实现整套系统的集中管理。


考虑到实施需要在现有生产系统的基础上,我们推荐采用支持异构环境的专业容灾解决方案,以提供高级别的容灾要求,通过科学的规范和管理实现应用级的容灾系统,获得优秀的RTO、RPO指标。


2  系统设计


2.1灾备网络总体架构设计网络系统的总体设计根据中国CDC信息化建设的总体设计要求,利用新址园区与旧址之间已有的CWDM设备(16波)构建两地之间的SAN存储网络互联环境和IP局域网络互联环境。总体网络规划如图2所示。


中国疾控中心数据容灾系统的设计与实现

图2 容灾系统总体规划逻辑拓扑图


2.2 灾备系统存储系统设计本设计主要采用虚拟存储池技术,实现将不同厂商的存储系统集合到同一个存储池中,进行存储统一管理。通过存储虚拟化技术可实现数据的本地整合与远程复制,以确保灾难备份中心与生产中心的数据保持同步,以实现数据灾难备份。  


存储作为整个数据中心的核心系统,其可靠性和可用性直接关系到整个系统的可靠性和可用性。且在关键系统的存储设计上,灾难备份和灾难恢复的能力、成本也是考虑的因素之一。


目前生产中心已有一套USP V存储系统。在本设计中以USP V虚拟化平台为核心系统,USP V存储平台内部的资源为内部存储资源,与之相连的其它存储设备上的资源是外部资源。通过该功能,可以使用统一的管理平台实现对内部和外部存储资源的统一管理、统一分配,可以按照应用系统的性能要求分配相应的存储资源,如图3所示。

中国疾控中心数据容灾系统的设计与实现

图3 USP存储虚拟架构图


本设计规划采用全新的USP V作为核心的在线业务存储;核心存储USP V、原有存储以及将来其它二级存储在一个统一的虚拟存储池内形成统一管理,系统架构见图4。


中国疾控中心数据容灾系统的设计与实现

图4 容灾系统USP虚拟存储架构图


3  系统功能


全国业务系统及中国CDC业务数据中心数据实现同城数据级容灾,数据级容灾备份为实时备份,数据级容灾灾难恢复能力恢复时间目标(RTO)<=2小时;恢复时间点目标(RPO)0-1分钟。本设计首先提供对中国CDC关键业务系统实现同城应用级容灾,且需要在灾难发生2小时内切换到灾备中心的容灾系统,恢复关键业务系统的正常运转。


3.1 数据级容灾所有核心业务系统的容灾建设是通过昌平中心USP V建立的存储虚拟池配置对南纬路灾备中心USP VM存储池的远程容灾数据复制。总体架构如图5所示。


中国疾控中心数据容灾系统的设计与实现

图5 远程数据复制总体架构图


本次设计的总体RPO要求控制在秒级,达到RPO<1分钟,而RPO的要求主要相关的是实际灾备链路提供的带宽,采用异步数据复制技术即HUR,HUR异步模式的方式数据传输见图6。


中国疾控中心数据容灾系统的设计与实现
图6 数据异步模式传输图


HUR的RPO=(Write Demand MB-Write Serviced MB)/Bandwidth,这是理论上的计算。实际计算采用如下方式:RPO=(峰值业务写带宽-可用的容灾链路带宽)/可用的容灾链路带宽×峰值持续时间。


根据测试结果,疾控中心峰值业务写带宽-30分钟以内测试可用的容灾链路带宽<2MB/s,而容灾链路采用CWDM达到带宽100MB/s,则RPO=(2/100)×30×60=36seconds,小于1分钟并满足容灾备份要求。


3.2应用级容灾应用级灾备系统是在数据级灾备系统基础上,实现应用系统的切换和回切,以保证业务的连续性。在应用级灾备系统建设时,只需在原有数据级灾备的基础上在灾备中心部署应用级应用系统相应的数据库和应用服务器,并安装配置数据库和应用程序。


当生产中心的业务系统恢复后,通过检查两端数据一致,可将灾备端应用系统反向回切到生产端。整个切换过程不影响其他业务系统在生产端的正常运行。


当生产中心的所有应用系统均不可用时,可将所有应用系统整体切换到灾备端运行,并通过存储复制软件,将所有应用系统的数据从灾备端反向复制到生产端。


当生产端恢复后,在检查两端数据的一致性和完整性后,可将灾备端应用系统回切到生产端运行。


4  结语


本设计在国家级公共卫生体系中首次采用容灾复制技术,建立疾控应急等多个系统的同城异地灾备中心,同时对未来建立双活数据中心,实现更高业务连续性的同城异地双中心容灾提供了良好基础;重点采用存储虚拟化技术,将生产中心多个存储系统进行统一整合,以此实现数据的本地整合和远程复制,确保灾难备份中心与生产中心的数据保持同步,以实现数据灾难备份。


本次设计涉及应用级容灾和数据级容灾两种技术,关键业务系统实现应用级容灾,在生产中心发生故障的情况下,能够在灾备中心接管应用,提高业务连续性;其他非关键业务系统实现数据级容灾,可确保用户原有的数据不会丢失或遭到破坏。


考虑生产中心与灾备中心距离较远,数据复制链路采用CWDM波分复用设备直连裸光纤,通过CWDM技术,既保证了裸光纤的高利用率,同时保证了多协议复用。另外,由于当前链路需要采用更具性价比的带宽,同时要保证对生产系统影响最小,因此设计生产中心到跨省异地灾备中心采用存储的异步数据复制方式,保证备份中心最小限度的数据丢失,确保数据的完整性和一致性。



相关评论

天津市医疗信息化建设协作联盟网http://www.his2000.com) 站长:郝工  投稿信箱:hao_shy#126.com (请将@代替#)

站为公益网站,所有内容来自原创或网络转载,仅供个人学习和研究使用,如侵犯您的版权请来电或来函指出,本站立即删除