A. 什么是容错容错技术主要包括哪些
容错FT(Fault Tolerant)技术一般利用冗余硬件交叉检测操作结果。随着处理器速度的加快和价格的下跌而越来越多地转移到软件中。未来容错技术将完全在软件环境下完成,那时它和高可用性技术之间的差别也就随之消失了。
局域网的核心设备是服务器。用户不断从文件服务器中大量存取数据,文件服务器集中管理系统共享资源。但是如果文件服务器或文件服务器的硬盘出现故障,数据就会丢失,所以,我们在这里讲解的容错技术是针对服务器、服务器硬盘和供电系统的。
B. 海德软件
首先,察看下屏幕右下角SQL SERVER 服务是不是已经启动 (启动的状态显示的是一个绿色的三角图标,没有启动或是启动失败显示的是一个红色的正方形或者没有任何颜色的图标)
如果图标显示的是红色正方形,SQL SERVER 服务启动失败,就需要进行手动启动,具体方法:双击右下的SQL SERVER 服务,会弹出SQL SERVER 服务管理界面,先点击刷新按钮,察看SQL SERVER 的实际状态,图标依然是红色正方形,那么就按下下方三个按钮中的第一个按钮“开始/继续”等待一会,等到图标变成绿色三角图标后,在运行海德商业管理系统后台程序或者输入服务器地址就可以到程序的登入界面了。
如果是绿色三角的情况下也不能进入海德商业管理系统后台系统的登入界面,那么就按下SQL SERVER 服务管理器界面上三个按钮中的第三个“停止”按钮将SQL SERVER 服务停止 ,使服务的状态变为停止状态显示的红色正方形,在执行一下A步骤将服务启动,等到图表再次变成绿色三角图标后,再运行程序就可以进入到系统中了。
C. 美国stratus容错服务器
容错服务器一般用在高等级的视频存储系统里面,我们原来初步设计是有用的,不过在施工图设计的使用采用了另外的技术。目前来说,在广东的高速公路行业中还是比较少见的。
D. 服务器和普通的机器主要的差别在哪
1,数据的容错
服务器为了保证机器的稳定,采用了许多容错的机制,比如硬盘容错,当坏了一个硬盘还可以正常使用,电源的容错,一般服务器都是双电源,当某个电源坏了,服务器不至于关机换电源,还包括cpu,内存等,都有容错,
2.硬件的热插拔技术
同时还支持热插拔,就是在不关机的情况下,可以拔出硬盘换掉坏的硬盘,拔电源等,这样对于那种24小时不关机的电脑,尤其重要
3.硬件性能更稳定
有时服务器的cpu不一定主频比家用的高,但是它更稳定,能够24小时工作,一般服务器一开机就是几个月,甚至更长的时间才再维护的时候关下作检查。
4.兼容性更好
服务器本身价格就贵,现在技术发展又快,不可能企业买了,过段时间就跟不上了,所以服务器的部件可以很方便的升级,(当然是厂家配套的),这样不需要花整台的钱,只需要换某个部件,服务器可以照样工作。
E. 双机热备系统的单机容错
主流应用的服务器容错技术有三类,它们分别是:服务器群集技术、双机热备份技术和单机容错技术。它们各自所对应的容错级别是从低到高的,也就是说服务器群集技术容错级别最低,而单机容错技术级别最高。由此可知它们各自应用的行业容错级别需求也是从低到高的。本文主要介绍后两种容错技术,先来看一下双机热备份容错技术。 双机热备份技术是一种软硬件结合的较高容错应用方案。该方案是由两台服务器系统和一个外接共享磁盘阵列柜(也可没有,而是在各自的服务器中采取RAID卡)及相应的双机热备份软件组成。
在这个容错方案中,操作系统和应用程序安装在两台服务器的本地系统盘上,整个网络系统的数据是通过磁盘阵列集中管理和数据备份的。数据集中管理是通过双机热备份系统,将所有站点的数据直接从中央存储设备读取和存储,并由专业人员进行管理,极大地保护了数据的安全性和保密性。用户的数据存放在外接共享磁盘阵列中,在一台服务器出现故障时,备机主动替代主机工作,保证网络服务不间断。
双机热备份系统采用“心跳”方法保证主系统与备用系统的联系。所谓“心跳”,指的是主从系统之间相互按照一定的时间间隔发送通讯信号,表明各自系统当前的运行状态。一旦“心跳”信号表明主机系统发生故障,或者备用系统无法收到主机系统的“心跳” 信号,则系统的高可用性管理软件认为主机系统发生故障,主机停止工作,并将系统资源转移到备用系统上,备用系统将替代主机发挥作用,以保证网络服务运行不间断。
双机热备份方案中,根据两台服务器的工作方式可以有三种不同的工作模式,即:双机热备模式、双机互备模式和双机双工模式。下面分别予以简单介绍。
双机热备模式即通常所说的active/standby 方式,active服务器处于工作状态;而standby 服务器处于监控准备状态,服务器数据包括数据库数据同时往两台或多台服务器写入(通常各服务器采用RAID磁盘阵列卡),保证数据的即时同步。当 active服务器出现故障的时候,通过软件诊测或手工方式将standby机器激活,保证应用在短时间内完全恢复正常使用。典型应用在证券资金服务器或行情服务器,这是采用较多的一种模式,但由于另外一台服务器长期处于后备的状态,从计算资源方面考量,就存在一定的浪费。 从上面的分析我们知道,双机热备份技术所采用的是两台配置完全一样的服务器系统,其实服务器群集方案中的容错技术也是一种多服务器容错技术。而本节所要介绍的单机容错技术则是在一台服务器实现高性能容错的,它的容错能力要远比服务器群集和双机热备份中容错能力要高,所以更加适合那些如证券、电信、金融、医疗等对容错能力特别苛刻的行业。
以往的集群系统在出现故障的情况下,需要中断服务器的运行,然后用一定的时间切换至备用的服务器上面进行运行,才能进行维修和恢复,这其中所付出的成本和带来的损失是用户最不愿意看到的。具有容错技术的容错服务器,最大的优势就在于它能够自动分离故障模块,在不中断运行的情况下,进行模块调换,对损坏的部件进行维护,并且在一切物理故障消除后,系统会自动重新同步运行,从而有效的解决了客户的后顾之忧。正因如此,具有容错技术的容错服务器,正在冲击前几年兴起的双机热备份和集群技术,越来越被人们所关注。同时,更为难得的是它可以在采用符合工业标准部件的服务器中实现(IA架构服务器),极具竞争力的成本优势,更使得容错服务器令人刮目相看。
容错服务器是通过CPU时钟锁频,通过对系统中所有硬件的备份,包括CPU、内存和I/O总线等的冗余备份;通过系统内所有冗余部件的同步运行,实现真正意义上的容错。系统任何部件的故障都不会造成系统停顿和数据丢失。很多容错系统是基于IA架构的服务器,与 Windows 2000完全兼容,实现以前只有在RISC系统上才能实现的容错。这种容错技术在IA服务器上的实现,将IA服务器的可靠性提高到了99.999%,同时服务器的运行是不间断的。
双机热备份和容错服务器的定位稍微有些不同,这是由两者实现的可用性差别决定的。双机热备份一般可以实现99.9%的可用性,容错服务器却可以实现 99.999%的可用性。这样,双机热备份大多应用在业务连续性不是很严格的行业,比如说公安系统、部队系统或者个别的制造企业,这些行业的应用允许数据有一小段时间的中断。而如电信、金融、证券和医疗等要求高的行业则是容错服务器的天下。还要注意的一点是双机热备份与服务器群集并不一样,双机热备份通常要求两对路服务器的配置完全一样,而服务器群集则没有这方面的严格要求,这也是许多读者容易混淆的。
另外,双机热备份方式由于需要至少2台服务器,导致在软件采购(操作系统、中间件、双机备份软件等)、软件维护升级、系统硬件升级都需要比单机容错方式多1倍的额外投入,而且在双机备份软件出现故障后,其维修的难度较高,对客户会带来较大困难。因此虽然单机容错服务器的硬件成本高于双机备份方式的硬件投入,而其总成本(TCO)却远远低于双机备份方式的成本。但是就其灵活配置方面,双机热备份方案更具优势,许多热备份方案都是由一些系统集成商组合不同厂家服务器产品进行的,可以满足不同客户需求。但总体来说,容错服务器是未来发展的趋势。
F. 容错系统与冗余系统的区别(机房综合布线)
容错简单地来说,就是发出错误的指令,经过系统自行纠错之后执行正确的指令。
冗余在数据中心内一般指网络冗余和电力冗余,网络冗余一般采用两家以上的网络服务提供商,保证在一家网络断路时,数据中心还能继续运行。电力冗余一般国内是两路市电,或一路市电加一路柴油发电机组。保证电力的正常供应。
G. 什么是系统容错
双机容错系统方案
一,双机容错系统方案综述
1.1 久强世纪 Storage Solution 双机容错系统
近年来,随着计算机技术的飞速发展,服务器的性能有了大幅度的提升,服务器作为处理关键性事物
的业务主机已随处可见.对于要求有高可用性和高安全性的系统,比如金融,邮电,交通,石油,电力,
保险证券等行业,用户提出了系统容错的要求.久强世纪公司推出基于Cluster集群技术的双机互备援解
决方案,包括用于对双服务器实行监控的HA 容错软件和作为数据存储设备的系列磁盘阵列系统.通过软
硬件两部分的紧密配合,提供给客户一套具有单点故障容错能力,且性价比优越的用户应用系统运行平台.
1.2 Cluster集群技术
Cluster集群技术:一组相互独立的服务器在网络中表现为单一系统,并以单一系统的模式加以管理.
此单一系统为客户工作站提供高可靠性的服务.
Cluster大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内任一系统上运行的服务可
被所有的网络客户所使用.Cluster必须可以协调管理各分离的组件的错误和失败,并可透明的向Cluster
中加入组件.
一个Cluster包含多台(至少二台)拥有共享数据储存空间的服务器.任何一台服务器运行一个应用
时,应用数据被存储在共享的数据空间内.每台服务器的操作系统和应用程序文件存储在其各自的本地储
存空间上.
Cluster内各节点服务器通过一内部局域网相互通讯.当一台节点服务器发生故障时,这台服务器上
所运行的应用程序将在另一节点服务器上被自动接管.当一个应用服务发生故障时,应用服务将被重新启
动或被另一台服务器接管.当以上任一故障发生时,客户将能很快连接到新的应用服务上.
1.3久强世纪 Storage Solution 双机容错系统方案
Cluster集群可由N台服务器组成,当Cluster最小值N=2时,即为双机容错集群系统.
久强世纪Cluster双机容错系统结合了磁盘阵列产品的安全可靠性与HA监控软件技术的优点,将二
者的优势相互配合.使用软件与磁盘阵列结合的方案,可以有效提高主机工作效率,减轻服务器和网络设
备压力,保证系统稳定性.
二,系统概述
2.1 功能概述
·如果硬盘发生故障时,磁盘阵列柜会有蜂鸣声告警,同时硬盘架面板上的状态指示灯变成红色(正
常时为绿色),以便提醒用户进行及时有效的维护
·独特的硬盘保护环路设计,可以确保故障硬盘插拔时,即刻隔断与SCSI总线的连接,而不会影响
SCSI总线上的信号
·即时响应: 控制器在硬盘发生故障时即刻识别错误信息
·支持环境监控(当机箱内温度过高时会有蜂鸣告警声)
·冗余电源备份(支持热插拔)
·热插拔风扇
·系统安全密码锁定
·当柜门关闭时,仍可观察到控制器及硬盘工作状态
·支持不同品牌,容量,型号的SCSI硬盘
2.2 阵列柜结构
AccuSTOR S940阵列柜的组成包括RAID控制器,双电源保护装置,支持热插拔的硬盘盒(Mobile Rack)
等,大部分部件具有冗余能力,可以全面保护硬盘和数据的安全.
AccuSTOR S940的RAID控制器使用64-bit RISC处理器,基本缓存(CACHE)为64MB, 控制器提供4个
通道(Channel),其中两个为主机通道(Host Channel),2个为设备通道(Disk Channel),可同时接驳8块
硬盘,最大RAID5容量为7X146GB=1.02TB.
在控制器中,可以方便的给设置0,1,3,5,0+1级的RAID组.控制器带有Monitor接口,用户可
以通过该接口使用终端或终端仿真程序进行设置,可以对控制器的BIOS程序进行升级.
在阵列柜的顶部预留一个插槽,用户可以选装一个备份RAID控制器,以提高系统的可靠性.
AccuSTOR S940或内部与SCSI硬盘的接口是采用SCA-2规格的整体式后背板,可以直接使用80Pin
热插拔硬盘,配备转换口后,也可使用80Pin Ultra2/Ultra160硬盘.每一硬盘插槽配有隔绝保护IC,以
消除硬盘在热插时的电流负效应,避免瞬间电流造成对硬盘或控制器的损害.
AccuSTOR S940阵列柜安装双份热插拔电源,每个电源的功率300W,通过调整电压开关该电源可以在
110/220V电压下工作.
正常情况下,双电源在Share状态工作,各输出150W功率,保证电源的使用寿命.如果其中一只电
源发生故障,另一电源将自动转换到300W 输出功率状态,使阵列继续正常运转.同时系统将通过液晶屏
幕和蜂鸣方式发出警报,用户可以将损坏的电源直接拔除,而不必关闭阵列.
机箱后背板上装有四个热插拔冷却风扇,风扇的启动温度和转速受ENC控制,用户可以通过ENC上的
DIP开关进行设定.所有风扇均采用德国标准的三钢珠结构,使其使用寿命大大延长.
阵列柜中安置有8个硬盘盒,可以接驳80针Ultra2/Ultra160 SCSI硬盘和SCA硬盘,普通硬盘接入
阵列后,即支持热插拔功能.Mobile Rack可自动为硬盘设置ID,前面板上有指示灯,可以显示硬盘的工
作状态.
阵列柜后面板上装有HOST-A,HOST-B接口各两个,用来接驳主机.Monitor口可接至终端或PC机,
用来进行阵列的设置.Modem口可以接驳调制解调器,用于传真和Pager方式的远程报警.UPS口可连接
UPS电源,当断电时UPS系统会送出一PowerFail信号到此UPS接口上,此时磁盘阵列控制器会即刻将缓
存(Cache)的资料完整地写入磁盘中,并关闭缓存,如服务器再有资料传来则会直接写入硬盘内,直到电
源恢复正常.两个设备通道接口配备终结器,用户可以串联机柜或其他SCSI设备.
2.3 双机容错系统软件 HA
久强世纪 Storage Solution双机容错系统解决方案提供专用双机软件:HA.
HA For NT 作为目前市场上最为成熟的双机容错软件,以其友好图形操作界面,方便的配置与管理被
广泛应用于政府,学校,电信,电力,石油,交通等行业.
通过装在两个服务器中的双机热备份应用软件HA,系统具有在线容错能力,即当处于工作状态的服
务器无法正常工作时,通过双机系统容错软件,使处于守候监护状态的另一台服务器迅速接管不正常服务
器上的业务程序及数据资料,使得网络用户的业务交易正常运行,保证交易数据的完整一致性及交易业务
的高可靠性.
通过架设与两台服务器间的侦测网络,HA for NT软件能够对两台服务器的软硬件运行状态实行监控.
HA For NT具有两种工作模式:
Hot Standby:即双机热备份,两台服务器为生产机--备份机关系.当生产机发生故障时,备份机自
动接管生产机的任务和数据,使拥护业务交易正常运行.使用者可在最短时间内回复作业,使客户的应用
不必中断,减少主机停机所造成的损失.
Daul Active:即双机互备援.两台服务器各运行不同的应用任务,并互相作为备份机.当两部主机
中任一主机当机时,另一部主机可迅速接替故障主机任务.
三,系统整合
久强世纪 Storage solution双机容错系统是由HA容错软件与磁盘阵列有机组合的成熟方案.整个
系统的组合架构工作包括三个方面:
1)硬件系统的连接
2)容错软件的安装和配置
3)与用户应用的整合
3.1 硬件系统的连接
硬件部分的连接主要包括磁盘阵列与主机的连接和侦测网络的连接.
用户可以将支持多主机的磁盘阵列系统分别连接至两台服务器的SCSI接口. 磁盘阵列系统提供两条
标准68Pin外接SCSI电缆,可与任何服务器的Ultra 3 SCSI接口接驳.用户不需要在服务器上增加任何
硬件设备或驱动程序.磁盘阵列连接至主机后,用户可以象增加普通硬盘那样对其进行分区,格式化,安
装文件系统等操作.
HA for NT可使用三种侦测网络.
RS232线路:只需使用软件附带的专用电缆将两台服务器的串口连接即可;
TCP/IP:使用直连网线或通过交换设备(Switch或Hub)连接两台服务器的网卡;
Share Disk:在磁盘阵列柜上设置双主机共享的8MB分区;
以上三种侦测网络可同时使用,互为备份,有利于提高双机系统的可靠性.
3.2 容错软件的安装和配置
HA容错软件的安装简单快捷.整个安装过程中,用户不需要进行繁琐的安装选择,或更改服务器硬
件配备或操作系统设定与容错软件配合.
HA for NT具有友好图形用户界面(GUI),使容错软件的配置管理成为轻松的工作.
3.3 与用户应用的整合
久强世纪 Storage solution双机容错控制系统能够提供具有相当容错能力的应用系统平台.它既可
以同所有大型数据库配合使用,也可监管用户自主开发的应用软件.在与容错系统整合时,只需将数据库
系统分别在两台服务器安装,并将数据文件放置于共享的磁盘阵列即可,而不需要对应用程序进行任何更
改.
H. 什么是容错系统请举例说明!
其实双机热备和双机容错是一个概念;
从广义上讲,双机热备(双机容错)就是对于重要的服务,使用两台服务器,互相备份,共同执行同一服务。当一台服务器出现故障时,可以由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续提供服务。
双机热备一般情况下需要有共享的存储设备。但某些情况下也可以使用两台独立的服务器。
从狭义上讲,双机热备特指基于active/standby方式的服务器热备。服务器数据包括数据库数据同时往两台或多台服务器写,或者使用一个共享的存储设备。在同一时间内只有一台服务器运行。当其中运行着的一台服务器出现故障无法启动时,另一台备份服务器会通过双机软件的诊测(一般是通过心跳诊断)将standby机器激活,保证应用在短时间内完全恢复正常使用。
I. 什么是服务器的容错技术
有备无患的做法,向来都是优质的香港机房拥有的作风,这表现在了电源、带宽线路等方面的冗余配置。尽管机房能够提供服务器在突发情况下正常运行的冗余配置,但是站长要想网站服务器能安安稳稳运行完服务期的话,那么壹基比小喻认为香服务器机房需要拥有以下5点的容错性。
一、冗余的电源供应
站长需要确保选用的香港机房拥有冗余的电源供应,包括企业级不间断电源、定期检测的备用发电机等。尽管停电可能只会偶尔发生,但是选择到香港机房如果不具备没有冗余电力,这可能导致租用的香港服务器因短时间电力难以恢复的问题而导致网站业务持续中断。因此选择香港机房很重要,精心设计的电力系统会解决本地电源故障、电压变化以及短期和长期停电问题。
二、服务器硬件冗余
硬件非常重要。香港服务器中的硬件设备和网络硬件都应该是以冗余的方式构建。如果您选择的服务商和数据中心足够负责,这些设施都应具备。其中,香港服务器租用,通常都接入多条国际线路,以BGP智能切换最佳路由,保障网络冗余,顺便一提,葵芳的香港服务器租用,已接入中国电信CN2专线直达香港,大陆访问更快更稳定。关于服务器硬件的冗余,一般需要客户付费部署RAID磁盘阵列,可提供更高的数据可靠性。
三、保持软件最新版本和补丁更新
香港服务器中软件需要保持更新,尤其是与安全相关的软件。毕竟,大量的服务中断是由应用程序故障引起的,例如弹性负载平衡软件故障等。而且,未及时更新版本和安全补丁,容易被黑客入侵进而导致更严重的损害。
四、服务器硬件故障监控
针对硬件设施提供密切的监控是不可缺少的。站长应当随时保持对服务器硬件和软件的密切关注,并确保有一个系统可以在突发故障时即时提醒您。当然,可靠的香港服务器租用服务商一定会部署这样的实时监控系统。因此站长在选择香港服务器租用时应当确认服务商是否具备这样的部署。
五、降低人为操作的失误率
在引发在线业务停滞的事件中,大多数情况不是由服务器或者数据中心引起的,而是应用程序故障、系统缺陷以及人为错误操作导致的。因此,站长就需要尽可能提升服务器管理水平或者请专业人士来管理服务器。
J. 容错技术的容错技术的历史
上世纪80年代,第一代容错技术就开始进入商用领域。美国Stratus(容错公司)在Stratus独特的硬件级容错技术及VOS专有操作系统环境下,采用了Motorola M68000处理器。
1993年,英特尔 I860处理器在Stratus的硬件级容错体系结构中成功应用,在软件环境方面,还能满足业界对开放性要求的Unix操作系统FTX,即AT&T UNIX SVR4。
1996年,容错技术得到HP的支持,共同推出Stratus Continuum系列,将Stratus容错结构结合HP PA-RISC对称多处理技术。
进入21世纪以来,制造、中小企业、能源、交通等领域对服务器,特别是中低端IA服务器的需求激增,过去仅仅可以应用在RISC平台、HP-UX环境下的容错产品也面临着新的挑战。另一方面,企业越来越依赖信息系统来完成关键业务的应用,同时他们不可能配备更多的专业人员来进行专职维护。双机热备、集群服务器遇到难题。
如今:NEC通过与美国容错公司多年的合作,于2001年推出了业界第一台基于IA架构、支持Microsoft Win-dows Server 2000标准操作系统环境的容错服务器。NEC的Express5800/ft系列在Windows及Linux平台上的可靠性达到了99.999%,这种实时保护技术来源于STRATUS连续处理技术(Fundamentals of Continuous Pro-cessing Design),它包括: FAILSAFE 软件和LOCKSTEP技术运行一样,可防止很多软件错误和储运耗损。该软件在Windows 2000/2003环境下采用热插拔、内存镜像、负载均衡、多点终止失效、多通道I/O等方式,大大增强了系统连续运行的稳定性。
FAILSAFE可以管理和诊断特征捕获,分析和通报服务器的软件问题,从而允许个人在软件发生错误之前去纠正错误。FAILSAFE软件的下列功能增强了NEC Express5800/ft系统在Windows环境中的可靠性:保护短暂的硬件故障;通过增强的驱动程序预防软件失效;软件问题的捕获、分析及修正;内存数据的连续性维持;丰富的纠错功能可以解决各种不同的错误。为了避免物理撞击等意外故障,安全故障软件还提供了自动重启功能,能够将宕机前CPU与内存数据即时保存下来,最大限度地避免数据的意外丢失。 当然,假如容错服务器的硬件发生永久性故障,尽管系统能够正常运行,也必须及时更换硬件才能维持容错的冗余架构。容错服务器都配备了简易直观的图形界面来管理监测工具,(如NECExpress5800/ft提供了ESMPRO 管理软件),能够对服务器中硬件运行及故障状态进行适时监控。