0 引言
广州地铁自动售检票系统(Automatic Fare Collection ,AFC)是基于计算机、通信、网络、自动控制等技术,实现城市轨道交通售票、检票、计费、收费、清分、管理等全过程的自动化系统。AFC系统共分为车票、车站终端设备、车站计算机系统、线路中央计算机系统、清分系统五个层次。其中清分系统亦即轨道交通清分综合中央计算机系统(Integrated Central Computer System,ICCS)为AFC系统的数据中心,主要用于广州市轨道交通各条线路之间,与公交系统、银行系统及其他相关系统之间的清算分账、车票交易数据的处理及统计分析,同时还具备对线路AFC系统设备运营管理的功能。ICCS远期定位于整个广州市及珠江三角洲城际轨道交通系统的清分中心和AFC运营管理中心,服务于整个广州市轨道交通线路的收益清分,实现整体处理车票交易数据及统计分析,但不涉及具体线路的内部运作。 清分体系是轨道交通线网票务数据的顶级收敛口,其建立及原则的制定最终服务于“数据综合应用”的目的,除了满足日常的结算业务外,更重要的是使得体系内所汇集的各类票务数据能被有效整合、利用。为了提高清分系统的健壮性和可用性,增强系统抵御突发性灾难的能力,建立了容灾系统,即使发生系统灾难,也能快速地恢复系统和数据,确保业务的连续性。
1 容灾技术概述
容灾(disater tolerant)是指除了本地系统以外,用户另外建立的冗余系统,当灾难发生本地系统受到破坏时,冗余系统可以接管用户正常的业务,达到业务不间断的目的。容灾表现为一种未雨绸缪的主动性,而不是在灾难发生后的“亡羊补牢”。
1.1 容灾原理 容灾技术的基本原理就是数据备份。数据备份是指为防止由系统故障所导致的数据丢失,而将全部或部分数据生产中心的主机系统存储设备复制到其他的存储介质的过程。数据备份是用户进行容灾系统建设的第一步,也是最终容灾系统恢复的基础。
随着业务数据的不断增加和可用性要求不断提高,传统的离线、在线备份根本无法满足需求。要想达到抵御灾难的目的,必须选用专门的软硬件设施,制定相应的容灾方案。虽然容灾的核心是备份,但其不同于一般意义上的数据备份,因为通常的备份存储系统总是与工作系统处于同一位置,而容灾备份是通过在异地建立和维护一个备份存储系统,利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。因此,容灾与备份的根本区别在于容灾不仅要保证企业数据的安全可靠,同时要保证业务的连续性。 1.2 容灾系统的构成
容灾系统应包括两个层面的问题:数据容灾和应用容灾。
数据容灾就是指建立一个异地的数据系统,该系统是本地关键应用数据的一个实时复制。在本地数据及整个应用系统出现灾难时,系统至少在异地保存一份可用的关键业务的数据。应用容灾是在容灾的基础上,在异地建立一套完整的与本地系统相当的备份应用系统,在灾难情况下,远程系统迅速接管业务运行。数据容灾是容灾系统的基本要求,而应用容灾是系统建设目标,应用容灾必须建立在数据容灾的基础之上,通过整合应用系统、网络系统等各种资源来实现。 1.3 容灾关键技术
在建立容灾系统时会涉及到多种技术,目前,关键的技术主要有:远程复制技术、快照技术、基于SAN的互连技术、虚拟存储等。
1.3.1 远程复制技术
远程复制技术是将主点数据中心的数据复制到远程的备份数据中心,随着更新在主站点的执行,远程站点保持与主站点的同步,远程复制技术是容灾备份技术的核心技术,同时也是保持远程数据同步和实现灾难恢复的基础。
1.3.2 快照技术
快照是通过软件对要备份的磁盘子系统的数据快速扫描,建立一个要备份数据的快照逻辑单元号LUN和快照cache。在快速扫描时,把备份过程中即将要修改的数据块同时快速拷贝到快照cache中。快照LUN是一组指针,它指向快照cache和磁盘子系统中不变的数据块(在备份过程中)。在正常业务进行的同时,利用快照LUN实现对原数据的一个完全的备份。它可使用户在正常不受影响的情况下,实时提取当前在线业务数据。其“备份窗口”接近于零,可大大增加系统业务的连续性,为实现系统真正的7×24运转提供了保证。
远程复制技术往往同快照技术结合起来实现远程备份,即先通过远程复制技术把数据备份到远程的存储系统中,再用快照技术把远程存储系统中的信息备份到远程的磁带库、光盘库中。
1.3.3 基于SAN的互连技术
主点数据中心和备点数据中心之间的数据备份,可通过运用SAN的远程复制技术来实现。目前,出现了多种基于IP的SAN的远程数据容灾备份技术。它们是基于IP的SAN的互连协议,将主点数据中心SAN中的信息通过现有的TCP/IP网络,远程复制到备援中心SAN中。当备点数据中心存储的数据量过大时,可利用快照技术将其备份到磁带库或光盘库中。这种基于IP的SAN的远程容灾备份可以跨越LAN、MAN和WAN。
1.3.4 虚拟存储
虚拟存储技术在系统弹性和可扩展性上开创了新的局面,它将几个IDE或SCSI驱动器等不同的存储设备串联为一个存储池。存储集群的整个存储容量可以分为多个逻辑卷,并作为虚拟分区进行管理。 2 容灾技术在城市轨道交通系统中的应用
 图 1 容灾系统组成框图
广州地铁AFC清分系统采用远程复制技术实现异地数据容灾,容灾系统框图如图1所示。系统中主点配置为2台Sun Fire 6800数据服务器,以群集方式运行,两台服务器通过心跳(Heartbeat)方式检测比此的状态, 实现热备份。操作系统为Solaris 9,使用Sun Cluster 3.1群集管理软件。备点配置为1台Sun Fire 6800数据服务器,操作系统为Solaris 9。主点和备点服务器上分别安装Sybase Adaptive Server Enterprise 12.5。复制服务器软件Sybase Replication Server12.6运行在备点数据库服务器上,通过基于事务的复制方式实现主点与备点之间的数据复制。下面分别对容灾系统的数据级容灾和应用级容灾进行阐述,重点给出数据级容灾的实现方法。
2.1 数据级容灾的实现
2.1.1 数据复制产品
容灾系统中的远程数据复制产品选用Sybase 复制服务器RS(Replication Server)。该技术是Client/ Server环境下实现数据高可用性的一种方法。一个完整的复制服务器RS系统应包括:主备点ASE ,RS(Replication server) , LTM(Log Transfer Manger) 或Rep Agent,RSSD(RS System Database),如图2所示。RS的复制分为基于表的复制和数据库的复制两种。考虑到数据一致性维护的简易性,采用基于数据库整库的复制模式。
 图2 sybase复制结构示意图
2.1.2 复制同步准备
为不影响清算业务的正常运行,复制同步在非业务进行时间进行,其中主点复制器名为:PS,备点服务器名为:BS,复制服务器名为:ccds_rep,复制服务器系统数据库名为:RSSD,预复制的数据库名为:dt_center,复制同步过程如下: 1、停用主点数据库dt_center的Rep agent 线程
isq1 -Usa -P -SPS
> use dt_center
> go
> sp_stop_rep_agent dt_center
> go
2、执行忽略辅助截断点操作,以免在复制未开启时主点的日志堆积导致日志空间的不可用
> dbcc settrunc (‘ltm’,‘ignore’)
> go
3、 截断主点数据库dt_center的日志
dump tran dt_center with truncate_only
4、备份主点数据库dt_center
dump database dt_center to‘/export/home/sybase/dt_center.dmp’
2.1.3 数据复制同步步骤
1、以单用户模式重启复制服务器
Startserver -f RUN_ccds_rep
2、清空复制服务器稳定队列中的数据
isq1 -Usa -P -Sccds_rep
> sysadmin sqm_purge_queue ,q number ,q type
> go
q number和q type的值使用admin who或admin who,sqm或admin who,sqt查找,其中:q type=0 表示出站队列,q type=1 表示入站队列。
3、登录到复制系统数据库,对主点数据库执行LTM清空操作
isql -Usa -SBS
> use ccds_rep_RSSD
> go
> rs_zeroltm PS,dt_center
2> go
4、关闭复制服务器
isq1 -Usa -P -Sccds_rep
> shutdown
> go
5、在复制点装载(load) 主点dt_center数据库的备份
> load database dt_center from‘/export/home/sybase/dt_center.dmp’
> go
6、以正常模式重启复制服务器
Startserver -f RUN_ccds_rep
7、恢复主点数据库的辅助截断点
isq1 -Usa -P -SPS
> use dt_center
> go
> dbcc settrunc (‘ltm’,‘valid’)
> go
8、恢复主点数据库的复制代理
> sp_start_rep_agent dt_center
> go
2.1.4 复制同步后续工作
数据复制同步后,查看相关DSI和Agent是否已经UP,并进行复制测试,根据复制日志及时排错,确保复制功能成功启用。
复制技术作为Sybase数据库系统的关键技术之一,采用传递事务而不是数据行的复制机制,这样可以大大减少数据的传送量,并能够有效地保证数据一致性、可靠性。通过以上的操作,实现了容灾系统中数据级的容灾。 2.2 应用级容灾的实现
在建立了以上数据级容灾的基础上,在异地容灾中心建立一套完整的与主点数据中心系统相同的关键业务应用系统,确保在灾难情况下,远程系统能迅速接管业务运行。 3 小结
建立性能稳定的灾备中心并不意味着从此可以高枕无忧,还必须要制定灾备的管理制度。广州地铁清分中心从容灾系统的基础理论出发,构建满足信息系统性能要求的容灾系统的同时相应制定了一系列日常备份制度和灾难恢复措施,如灾备恢复流程,并在实践中不断进行评估、演练并加以完善,以保证灾备不仅仅是形式上的内容,能真正意义上确保主点故障情况下业务的连续性。
参考文献
[1] 单桂军,容灾技术在校园网络信息中心安全中的应用与研究[J].太原师范学院学报(自然科学版),2006,9(5):40-43 [2] 杨晓红,李健,杨卫国.信息系统容灾技术的分析与研究[J].计算机工程与设计,2005,10(10):2727-2729 [3] 李兆玉,韦世红,李鸫.容灾系统的建设方案研究[J].重庆邮电学院学报(自然科学版),2005,8(4):478-482 [4] 王渝次.信息系统灾难恢复的规划及实施[M].北京:北京交通大学出版社,2006 [5] 朱跃龙,洪筱菡.Sybase Replication Server12. 0 的复制服务器技术研究及应用[J]. 计 算 机 与 现 代 化,2002,12,59-62
|