㈠ 两台服务器,如何进行双机热备
双机主要分两种,一种是磁盘阵列柜的硬件双机热备;一种是没有磁盘阵列柜的纯软双机热备.如果没有磁盘阵列柜的话,只能做纯软双机,那你需要购买两个双机软件,才能做,一个是双机热备份软件:如ROSS或PLUS WELL等,别一个是双机镜像软件MirrorHA,
以ross为例:
1.纯软件双机热备份
两台服务器通过网络连接,硬件配置少了磁盘阵列 , 软件配置上,除了 Cluster 之外,新增了 NT Mirror , NT Mirror 是 ROSE 公司的网络数据镜像软件。
图 2 纯软件双机热备份系统
2 、 系统工作原理
与常规的双机系统相比,纯软件双机热备份系统的两台服务器之间少了公共的存储设备(通常是磁盘阵列),但是多了网络数据镜像软件 Mirror 。没有了公共存储设备磁盘阵列,对于某一个需要进行切换的服务而言,怎样保证其所用的数据在两台服务器上是一致的呢?这就是数据镜像软件 ROSE NT Mirror 的功能所在——— NT Mirror 通过网络,将某一台服务器上指定路径下的数据采用同步或异步方式,镜像到另一台服务器。
镜像软件取代双机热备份系统的磁盘阵列,关键之处在于其必须与 Cluster 软件协同工作。当某一服务运行于服务器 A 时,它所使用的特定数据在服务器 A 上对应于一个数据集合Ф A, 通过 NT Mirror 将源数据集Ф A 镜像到服务器 B 成为目标数据集Ф B, 当 NT Cluster 将该服务程序从服务器 A 切换到服务器 B 时,它使用服务器 B 上的数据Ф B, 同时 NT Mirror 自动修改原来从Ф A 到Ф B 的镜像成为从Ф B 到Ф A 的镜像。对一个服务程序是这样,对多个服务程序,则一一建立服务程序与数据镜像集之间的关系。这样,无论服务程序运行于哪一个服务器,始终保证其所使用的数据在对端服务器有一份镜像存在;当一台服务器由于硬件或软件原因发生故障失效 , 另外一台可在保证提供自己原有服务的同时 , 启动失效服务器的应用程序从而取代其服务器功能。
3 、运作方式:
在正常的运作情形之下,主机之间透过冗余侦测线路互相侦测,当任一主机有错误产生时, ROSE HA 提供严谨的判断与分析,确认主机出错之后,启动备援接管动作。
支持各种操作系统平台: Unix 、 Linux 、 Windows Server 等。
支持各种数据库: 数据库SQL 、 Oracle 、 Informix 、 Sysbase 、 Exchenge 、 Lotus/Nose 、 DB2 等
接管动作包括 :
文件系统 ( File System)
数据库 ( Database)
网络地址 ( IP Address)
应用程序 (AP)
系统环境 (OS)
容错备援运作过程
• 当一台活动服务器宕机时,其 IP 地址、服务器名称及运行的作业会自动转移至另一台服务器,客户端软件不需要重新设定,只要重新连结至原来的 IP 地址及服务器名称即可继续作业;
• 两台服务器的信息交换可通过: RS232 、 TCP/IP
• ROSE HA 采取高可靠的错误检测和故障恢复机制减少系统宕机,停机时间并防范错误,提供故障警告;
• ROSE HA 可设定故障排除后自动或手动回复 ( switch back );
• ROSE HA 安装时不需要修改操作系统的核心、更改应用软件,也无需特殊的硬件;
• ROSEHA 提供基于 GUI 的监控中心,管理员能查看 ROSE HA 的状态、检查错误信息和警告、修改系统参数及从远程工作站管理 ROSE HA 系统;
• 与数据库无关,可以支持各种数据库,包括 ORACLE 、 Sybase 、 Informix 等
管理工具:
• 友好、直观、易于操作的 GUI 界面
• 有关 ROSE HA 的配置都可以在 GUI 中完成,支持动态配置和实时同步
• 网卡的状态,磁盘的状态都可在 GUI 中显示出来
• 用户可通过第三方 Web 浏览器进行远程管理
监控的对象资源:
• Volume
• IP 地址
• 计算机别名
• 共享文件
• NT 服务
• 用户自定义
总之, ROSE HA 软件极大程度上减少了人的介入,提高了系统的可靠性与安全性,使服务能可靠的运行。
四、系统特点
纯软件高可用方案,是双机高可用软件和网络数据镜像软件的完美结合。可以概括如下:
• 系统成本低:不需要磁盘阵列,降低了系统成本。
• 系统抗灾难能力强。
• 构成双机系统的两台服务器通过网络连接,可以相隔很远的物理距离,增强了系统的抗灾难能力。
• 双向的失效切换功能。
• 双向的失效切换,又称 ACTIVE/ACTIVE 冗余方式,是指为用户提供两台可运行重要应用的全功能服务器 并确保它们中任何一台失效时另外一台可自动代替其功能。
• 系统资源占用少系统效率高。
• 数据镜像可以绑定到某一对网卡上完成,不占用服务器网络资源,减轻服务器负载,提高系统效率。
• 服务器无需相同。
• 双机热备份的两台服务器在硬件和软件配置上无须相同。
• 无需停机的设备维护能力。
• 由于应用程序可以在两台服务器之间自由切换,用户可由此实现在不停止网络服务前提下对其进行维护工作,如日常检查 . 维修或测试;而此时前台工作站可以完全透明地保持在工作状态。
• 简单易用功能全面的管理窗口。
• 面向对象的管理窗口使您只需移动鼠标,就可以配置和管理整个双机热备份系统。
• 从资源定义到服务程序的切换,都可以轻松完成。
系统要求:
• 两台服务器配置无需相同 ( IBM 服务器有例外)
• window NT/windows 2000 、 2003 操作系统版本一致
• 用于公用网络的网卡( Ethernet,Fast Ethernet,FDDI 或 ATM 卡 ) 用于私用网络的网卡或 RS-232 串口线
2.硬件双机热备份:可以用Win2003企业版也可以做.
㈡ 双机热备份的操作方法
双机热备有两种实现方式,一种是两台服务器通过一个共享的存储设备(一般是共享的磁盘阵列或存储区域网SAN),通过安装双机软件实现双机热备,称为共享方式。另一种方式是没有共享的存储设备,数据同时存放于各自服务器中,称为纯软件方式或软件同步数据方式。基于存储共享的实现方式是双机热备的最标准的方案,在主从模式工作中,两台服务器以一个虚拟的IP地址对外提供服务,服务请求发送给主服务器(active server)承担。同时,两台服务器通过心跳线(heartbeat line)侦测另一台服务器的工作状况。一旦主服务器出现故障,备服务器(standby server)根据心跳侦测的情况做出判断,在较短时间内完成切换,接管主机上的所有资源,成为新的主服务器。由于使用共享的存储设备,因此两台服务器使用的实际上是一样的数据,由双机或集群软件对其进行管理。
心跳线是主备服务器之间联系的纽带,所谓“心跳”,是一个错误检测机制,指主从系统之间相互按照一定的时间间隔发送通讯信号,周期性地检测各个节点的状态(包括系统的状态和应用的状态)。如果连续没有收到的心跳信号到了一定的数目,双机热备软件就认为相应的系统已经出现故障,并进行主备切换。传统上心跳故障检测使用串口通讯的方式,但目前已经普遍使用基于TCP/IP的方式。两台服务器之间,可以使用直连网线,也可以将两台服务器用于心跳诊断的网卡通过交换机连接。
双机热备份技术需要通过双机或集群软件来实现。双机软件采用结构化设计,一般来说包含以下几个模块:
(1)双机状态的管理模块,负责检测双机的工作状态,以及对故障状态进行判断。
(2)双机功能的执行模块,负责执行管理模块发出的双机调整切换命令等。
(3)双机系统的客户端配置管理工具,通过该模块实现对双机系统的远程配置、管理及维护等功能。
双机软件工作流程大致如下:软件启动时,首先读取双机系统的配置文件,该文件描述了双机系统中各节点的网络信息、硬件描述以及任务的定义等参数。软件的核心程序根据配置信息,进行双机系统的状态重组,建立双机的初始状态。在节点初始状态建立起来后,管理模块根据当前网络状态的信息对双机进行调整并分配网络资源,使双机中的主节点获得对外提供网络服务的资源,同时启动节点监控功能,对所启动任务的关键进程进行监控,保障对外提供服务的资源健康。当以上资源建立起来后,双机系统进入正常运行状态。
当系统中有节点故障时,双机管理模块根据双机当前的状态和该故障节点在双机中的角色做出双机系统是否切换的选择。当该节点为主服务器时,双机系统会自动将属于该节点的资源和任务移交到备服务器上,保证网络的正常运行。如果发生故障的节点为备服务器,双机软件提出报警后,将任务的移交进行封锁,直到备服务器故障修复,重新进入双机系统,管理模块检查到该故障修复后,对当前的任务进行解锁操作,系统重新进入正常运行状态。
㈢ 有两台服务器,如何做双机热备份
具体操作步骤如下:
1、首先,可以使用图中所示的工具执行热备份,如下图所示,然后进入下一步。