繁体中文
设为首页
加入收藏
当前位置:技术首页 >> 方案库 >> 政府 >> 政府企业存储容错系统方案书

政府企业存储容错系统方案书

2006-10-29 23:52:51  作者:admin  来源:IT168  浏览次数:140  文字大小:【】【】【
关键字:存储

1.为什么需要双机容错系统

    对现代企业来说,利用计算机系统来提供及时可靠的信息和服务是必不可少  的,另一方面,计算机硬件和软件都不可避免地会发生故障,这些故障有可能给企业带来极大的损失,甚至整个服务的终止,网络的瘫痪。可见,对一些行业,如:政府机关(政府上网、国家和地区信息港)、大中企业(如其数据中心、企业的ERP、CRM)、大型的商场、超市的POS系统服务器等,系统的容错性和不间断性尤其显得重要。因此,必须采取适当的措施来确保计算机系统的容错性和不间断性,以维护系统的高可用性和高安全性、达到系统可用性和可靠性为99.999%。

2.双机容错系统简介

    根据用户提出的系统高可用性和高安全性的需求,推出基于Cluster集群技术的双机互备援解决方案,包括用于对双服务器实时监控的ROSE容错软件和作为数据存储设备的系列磁盘阵列柜。通过软硬件两部分的紧密配合,提供给客户一套具有单点故障容错能力,且性价比优越的用户应用系统运行平台。

3.Cluster集群技术

    Cluster集群技术可如下定义:一组相互独立的服务器在网络中表现为单一的系统,并以单一系统的模式加以管理。此单一系统为客户工作站提供高可靠性的服务。

    Cluster大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内任一系统上运行的服务可被所有的网络客户所使用。Cluster必须可以协调管理各分离的组件的错误和失败,并可透明的向Cluster中加入组件。

    一个Cluster包含多台(至少二台)拥有共享数据储存空间的服务器。任何一台服务器运行一个应用时,应用数据被存储在共享的数据空间内。每台服务器的操作系统和应用程序文件存储在其各自的本地储存空间上。

     Cluster内各节点服务器通过一内部局域网相互通讯。当一台节点服务器发生故障时,这台服务器上所运行的应用程序将在另一节点服务器上被自动接管。当一个应用服务发生故障时,应用服务将被重新启动或被另一台服务器接管。当以上任一故障发生时,客户将能很快连接到新的应用服务上。

4.双机容错系统软、硬件配置

硬件配置

两台可为不同类型的服务器(最好为同类型),如:HP  LH6000
服务器上的SCSI卡,如:AHA2940UW/2940U2W
服务器上的网卡(NIC),如:HP5031
磁盘阵列柜,如:WISE2000

软件配置

操作系统:NT40 或 UNIX(OS版本应相同)
容错系统 :GDS HA
数据库:Oracle、Sybase、SQL Server 等等
其它应用软件

5.工作模式 

  双机热备份(Hot Standby)

    所谓双机热备份就是一台主机为工作机(Primary Server),另一台主机为备份机(Standby Server),在系统正常情况下,工作机为信息系统提供支持,备份机监视工作机的运行情况(工作机也同时监视备份机是否正常,有时备份机因某种原因出现异常,工作机可尽早通知系统管理工作人员解决,确保下一次切换的可靠性)。当作机出现异常,不能支持信息系统运营时,备份机主动接管(Take Over)工作机的工作,继续支持信息的运营,从而保证信息系统能够不间断地运行(Non-Stop)。当工作机经过维修恢复正常后,它会将其先前的工作自动抓回,恢复以前正常时的工作状态。

6. 双机容错系统工作原理

GDS软件主要由监控与接管两部分组成

监控系统

SCSI侦测:

    ROSE内部含有侦测心跳通讯线路, 结果置于磁盘阵列柜上的一个8MB的小区,用于监控,此小区一般在机柜逻辑盘的起始段。对于某一台服务器而言,将侦测讯息以类似于记录方式写在该小区内,其中每一条记录包括如下内容:

(1)系统对本服务器的监测状态信息。
(2)另一台服务器是否看到本服务器状态的信息。

    当一台服务器有问题或出现故障时,对等服务器的可调变心跳频率不断提高;在最小心跳时间内发现记录内容没有更新,即会调用网络心跳侦测再次确认系统状态;当两组心跳都判断系统故障时,ROSE将故障服务器的交易业务在最小安全切换时间内切换到对等服务器上继续运行,同时修改记录区内容。

网络侦测:

    业务服务器对网络设备监测,同时配合SCSI心跳侦测,对等监控两台服务器的工作状态。当有一台服务器因为网络故障或其它原因引起故障而不能正常处理业务交易时,对等服务器的可调变心跳频率不断提高;在最小心跳时间内发现心跳记录内容没有更新,即会调用SCSI心跳侦测再次确认系统状态;当两组心跳都判断系统故障时,ROSE将故障服务器的交易业务在最小安全切换时间内切换到对等服务器上继续运行,同时修改记录区内容。

切换系统

网络服务:

    双服务器后台对于用户一端,由监控软件ROSE提供一个逻辑的IP Address,如:192.192.192.1,任一用户上网只需要用到这一地址;当后台有一台服务器出现故障时,另外一台服务器会自动将其网卡的IP Address 替换为192.192.192.1;这样,用户一端的网络不会因为一台服务器出现故障而断掉。

数据库服务:

    当有一台服务器出现故障时,另外一台服务器会自动接管数据库;同时启动数据库和应用程序,使用户数据库可以继续操作,对用户而言不受影响。

应用系统:

    当有一台服务器出现故障时,另外一台服务器会自动接管各类应用程序;同时启动应用程序,使用户可以继续操作,对用户而言不受影响。

7.双机容错系统的优点

与市场上其它同类软件比较,它具有以下特别的优势:

最少占用系统资源:

    GDS是一种需要配合硬件(阵列柜)使用的双机容错软件,由于使用共享的磁盘阵列作为数据源,所以不需要在两台服务器间架设专用网络,进行繁重的数据同步工作。有利于减轻主机及网络的负载,同时大大提高了系统在繁重业务下的可靠性。

跨平台工作:

    广泛应用于NT或UNIX平台

侦测可靠:

    软件可同时使用三种侦测网络,包括RS-232、TCP/IP、Share Disk。侦测网络架设方便,互为备份,具有极高的可靠性,可避免由于侦测网络故障而发生误切换。

切换安全:

    引入可根据具体应用而自由设定的最小安全切换时间机制,可有效防止业务繁忙状态下,主、备机不能及时交换信息引起的误切换。

数据永不丢失:

    使用具有容错能力的磁盘阵列系统作为外部数据存储器,可以防止由于硬盘损坏、数据丢失造成的重大损失。客户可以根据对容错能力、存储容量、硬盘访问速度、经济性等方面的需求灵活选择容错模式。
 
具有互备援能力:

    两台服务器可分别运行不同的任务,同时互为备援(Daul Active)。在需要两台服务器的网络中,使用这种工作方式,可以避免因单服务器故障引起的系统瘫痪。

兼容各种网络协议:

兼容包括TCP/IP、Netbuei、IPX/SPX、命名管道(NamePipe)在内的多种网络协议,虚拟主机可与Netware网络互联。

安装维护方便:

    GDS软件全部操作均为GUI图形用户界面,安装配备极为简单快捷。系统管理员可以通过直观动态的监视界面随时了解系统运行状态。而且系统安装完毕后不需要进行任何维护,即可自动运行。

应用广泛:

    目前,这套系统已经广泛应用于各个行业,能够为所有工作于NT or UNIX平台的大型数据库提供良好的支持,用户不需要改动应用程序设计。

无2000年问题:

    本双机系统所有硬件设备及软体均经过全面的测试,证明决无2000年的问题,可伴随用户系统安全跨越本世纪。

8. 切换时机(Take Over)

-系统软件或应用软件造成服务器当机
-服务器没当机,但系统软件或应用软件工作不正常
-SCSI卡损坏,造成服务器与磁盘阵列无法存取资料
-服务器内硬件损坏,造成服务器当机
-服务器不正常关机

9.建议方案

SERVER:HP LH6000 二套
OS:Windows NT 4.0 /WIN200 二套
Database:MS SQL
Diskarray:WISE 2000 一台
RAID LEVEL:RAID 5
硬盘5 块73X(7-1-1)=365GB 其中1块Hot spare      
CLUSTER:ROSE Cluster For Windows NT 4.0/WIN2000 一套
MODEL:Hot standby

实物连接(参见工作模式)

    由两台NT主机(计费、管理主机),共享一台磁盘阵列(Ultra2/Wide SCSI)及双机备份软件(GDS Cluster)组成。当有任何一部主机故障时,经由GDS Cluster的支援,在无系统管理者的操作下,自动执行备援切换程式,让使用者得以正常工作,不因主机故障而影响其作业时效,达到系统不停机时间为99.999%的目标。

责任编辑:admin

本文引用地址: http://tech.itzero.com/2006/1029/2896.html 请粘贴到你的QQ/MSN上推荐给你的好友

相关文章
Linux磁盘存储区管理原理与技巧
7个步骤为你的USB存储设备保驾护航
IDC扩容,安全、存储两不误
MySQL联手NitroSecurity开发存储引擎
加快SQL Server备份和重新存储的速度
存储过程之外:SQL注入深入防御
中国工商银行SAN架构存储案例
中国建设银行总行的EMC资金清算灾难备份系统
中国银行的EMC存储解决方案
KB823732:如何禁用 USB 存储设备
 

最新文章

更多

· 深思远程教育解决方案
· 无线家校通系统应用
· SPEED Networks:千兆主...
· 方正科技电子政务网络安...
· 方正入侵检测系统在某政...
· 方正电子政务系列解决方案
· Sybase政府行业分布式数...
· 城市公安综合信息系统解...
· 政府部门网络安全解决方案
· 政府企业存储容错系统方案书

热点文章

更多

其它推荐