Ⅰ 双机热备份的操作方法
双机热备有两种实现方式,一种是两台服务器通过一个共享的存储设备(一般是共享的磁盘阵列或存储区域网SAN),通过安装双机软件实现双机热备,称为共享方式。另一种方式是没有共享的存储设备,数据同时存放于各自服务器中,称为纯软件方式或软件同步数据方式。基于存储共享的实现方式是双机热备的最标准的方案,在主从模式工作中,两台服务器以一个虚拟的IP地址对外提供服务,服务请求发送给主服务器(active server)承担。同时,两台服务器通过心跳线(heartbeat line)侦测另一台服务器的工作状况。一旦主服务器出现故障,备服务器(standby server)根据心跳侦测的情况做出判断,在较短时间内完成切换,接管主机上的所有资源,成为新的主服务器。由于使用共享的存储设备,因此两台服务器使用的实际上是一样的数据,由双机或集群软件对其进行管理。
心跳线是主备服务器之间联系的纽带,所谓“心跳”,是一个错误检测机制,指主从系统之间相互按照一定的时间间隔发送通讯信号,周期性地检测各个节点的状态(包括系统的状态和应用的状态)。如果连续没有收到的心跳信号到了一定的数目,双机热备软件就认为相应的系统已经出现故障,并进行主备切换。传统上心跳故障检测使用串口通讯的方式,但目前已经普遍使用基于TCP/IP的方式。两台服务器之间,可以使用直连网线,也可以将两台服务器用于心跳诊断的网卡通过交换机连接。
双机热备份技术需要通过双机或集群软件来实现。双机软件采用结构化设计,一般来说包含以下几个模块:
(1)双机状态的管理模块,负责检测双机的工作状态,以及对故障状态进行判断。
(2)双机功能的执行模块,负责执行管理模块发出的双机调整切换命令等。
(3)双机系统的客户端配置管理工具,通过该模块实现对双机系统的远程配置、管理及维护等功能。
双机软件工作流程大致如下:软件启动时,首先读取双机系统的配置文件,该文件描述了双机系统中各节点的网络信息、硬件描述以及任务的定义等参数。软件的核心程序根据配置信息,进行双机系统的状态重组,建立双机的初始状态。在节点初始状态建立起来后,管理模块根据当前网络状态的信息对双机进行调整并分配网络资源,使双机中的主节点获得对外提供网络服务的资源,同时启动节点监控功能,对所启动任务的关键进程进行监控,保障对外提供服务的资源健康。当以上资源建立起来后,双机系统进入正常运行状态。
当系统中有节点故障时,双机管理模块根据双机当前的状态和该故障节点在双机中的角色做出双机系统是否切换的选择。当该节点为主服务器时,双机系统会自动将属于该节点的资源和任务移交到备服务器上,保证网络的正常运行。如果发生故障的节点为备服务器,双机软件提出报警后,将任务的移交进行封锁,直到备服务器故障修复,重新进入双机系统,管理模块检查到该故障修复后,对当前的任务进行解锁操作,系统重新进入正常运行状态。
Ⅱ linux下的服务器双机热备份,如何做
Linux上的heartbeat双机热备服务架设
【一】 安装前环境设定
两台主机硬件环境(不必完全一致):
CPU: Xeon 3G *2 (EM64T)
MEM: 2G
NIC: Intel 1G *2
eth0: 对外IP
eth1: 对内IP(HA专用)
两台主机的eth1使用双机对联线直接连接。
分区方式:
Filesystem 容量 挂载点
/dev/sda2 9.7G /
/dev/sda6 45G /Datas
/dev/sda1 99M /boot
none2.0G /dev/shm
/dev/sda3 9.7G /opt
另外每台主机应预留500M的raw空间或者更多来作为共用空间被HA使用。
操作系统:
RedHat Enterprise 4 Update2 (2.6.9-22 EL)
预安装软件:
@ X Window System
@ GNOME Desktop Environment
@ KDE Desktop Environment
@ Editors
@ Engineering and Scientific
@ Graphical Internet
@ Text-based Internet
@ Authoring and Publishing
@ Server Configuration Tools
@ Development Tools
@ Kernel Development
@ X Software Development
@ GNOME Software Development
@ KDE Software Development
@ Administration Tools
@ System Tools
【二】安装前网络环境设定:
node1: 主机名:servers201 ( HA01 )
eth0: 192.168.10.201 //对外IP地址
eth1: 10.0.0.201 //HA心跳使用地址
node2: 主机名:servers202 ( HA02 )
eth0: 192.168.10.202 //对外IP地址
eth1: 10.0.0.202 //HA心跳使用地址
特别注意要检查以下几个文件:
/etc/hosts
/etc/host.conf
/etc/resolv.conf
/etc/sysconfig/network
/etc/sysconfig/network-scripts/ifcfg-eth0
/etc/sysconfig/network-scripts/ifcfg-eth1
/etc/nsswitch.conf
#vi /etc/hosts
node1的hosts内容如下:
127.0.0.1 localhost.localdomain localhost
192.168.10.201 servers201 HA01
10.0.0.201 HA01
10.0.0.202 HA02
192.168.10.202 server202
node2的hosts内容如下:
127.0.0.1 localhost.localdomain localhost
192.168.10.202 servers202 HA02
10.0.0.202 HA02
10.0.0.201 HA01
192.168.10.201 server201
#cat /etc/host.conf
order hosts,bind
#cat /etc/resolv.conf
nameserver 61.139.2.69 //DNS地址
#cat /etc/sysconfig/network
NETWORKING=yes
HOSTNAME=servers201 //主机名
GATEWAY="192.168.10.1" //网关
GATEWAY="eth0" //网关使用网卡
ONBOOT=YES //启动时加载
FORWARD_IPV4="yes" //只允许IPV4
#cat /etc/sysconfig/network-scripts/ifcfg-eth0
DEVICE=eth0
ONBOOT=yes
BOOTPROTO=static
IPADDR=192.168.10.201
NETMASK=255.255.255.0
GATEWAY=192.168.10.1
TYPE=Ethernet
IPV6INIT=no
#cat /etc/sysconfig/network-scripts/ifcfg-eth1
DEVICE=eth1
ONBOOT=yes
BOOTPROTO=none
IPADDR=10.0.0.201
NETMASK=255.255.255.0
TYPE=Ethernet
[node1] 与 [node2] 在上面的配置中,除了
/etc/hosts
/etc/sysconfig/network
/etc/sysconfig/network-scripts/ifcfg-eth0
/etc/sysconfig/network-scripts/ifcfg-eth1
要各自修改外,其他一致。
配置完成后,试试在各自主机上ping对方的主机名,应该可以ping通:
/root#ping HA02
PING HA02 (10.0.0.202) 56(84) bytes of data.
64 bytes from HA02 (10.0.0.202): icmp_seq=0 ttl=64 time=0.198 ms
64 bytes from HA02 (10.0.0.202): icmp_seq=1 ttl=64 time=0.266 ms
64 bytes from HA02 (10.0.0.202): icmp_seq=2 ttl=64 time=0.148 ms
--- HA02 ping statistics ---
3 packets transmitted, 3 received, 0% packet loss, time 2002ms
rtt min/avg/max/mdev = 0.148/0.204/0.266/0.048 ms, pipe 2
【三】安装HA 与HA依赖包
rpm -Uvh libnet-1.1.2.1-1.rh.el.um.1.i386.rpm //可以不装
rpm -Uvh heartbeat-pils-2.0.4-1.el4.i386.rpm
rpm -Uvh heartbeat-stonith-2.0.4-1.el4.i386.rpm
rpm -Uvh heartbeat-2.0.4-1.el4.i386.rpm
rpm -Uvh ipvsadm-1.24-5.i386.rpm
【四】 配置 HA的各配置文件
配置心跳的加密方式:authkeys
#vi /etc/ha.d/authkeys
如果使用双机对联线(双绞线),可以配置如下:
#vi /etc/hc.d/authkeys
auth 1
1 crc
存盘退出,然后
#chmod 600 authkeys
配置心跳的监控:haresources
#vi /etc/ha.d/haresources
各主机这部分应完全相同。
server201 IPaddr::192.168.10.200 ipvsadm httpd
指定 server201调用ipvsadm启动http服务,系统附加一个虚拟IP 192.168.10.200 给eth0:0
这里如果server201宕机后,server202可以自动启动http服务,并新分配IP 192.168.10.200给server202的eth0:0
配置心跳的配置文件:ha.cf
#vi /etc/ha.d/ha.cf
logfile /var/log/ha_log/ha-log.log ## ha的日志文件记录位置。如没有该目录,则需要手动添加
bcast eth1 ##使用eth1做心跳监测
keepalive 2 ##设定心跳(监测)时间时间为2秒
warntime 10
deadtime 30
initdead 120
hopfudge 1
udpport 694 ##使用udp端口694 进行心跳监测
auto_failback on
node server201 ##节点1,必须要与 uname -n 指令得到的结果一致。
node server202 ##节点2
ping 192.168.10.1 ##通过ping 网关来监测心跳是否正常。
respawn hacluster /usr/lib64/heartbeat/ipfail
apiauth ipfail gid=root uid=root
debugfile /Datas/logs/ha_log/ha-debug.log
设置ipvsadm的巡回监测
ipvsadm -A -t 192.168.10.200:80 -s rr
ipvsadm -a -t 192.168.10.200:80 -r 192.168.10.201:80 -m
ipvsadm -a -t 192.168.10.200:80 -r 192.168.10.202:80 -m
执行后进行监测:
#ipvsadm --list
如果返回结果与下相同,则设置正确。
IP Virtual Server version 1.2.0 (size=4096)
Prot LocalAddress:Port Scheler Flags
-> RemoteAddress:Port Forward Weight ActiveConn InActConn
TCP 192.168.10.200:http rr
-> server202:http Local 1 0 0
-> server201:http Masq 1 0 0
【五】 HA服务的启动、关闭以及测试
启动HA: service heartbeat start
关闭HA; service heartbeat stop
系统在启动时已经自动把heartbeat 加载了。
使用http服务测试 heartbeat
首先启动httpd服务
#service httpd start
编辑各自主机的测试用html文件,放到/var/www/html/目录下。
启动node1的heartbeat,并执行这个指令进行监控: heartbeat status
【六】 防火墙设置
heartbeat 默认使用udp 694端口进行心跳监测。如果系统有使用iptables 做防火墙,应记住把这个端口打开。
#vi /etc/sysconfig/iptables
加入以下内容
-A RH-Firewall-1-INPUT -p udp -m udp --dport 694 -d 10.0.0.201 -j ACCEPT
意思是udp 694端口对 对方的心跳网卡地址 10.0.0.201 开放。
#service iptables restart
重新加载iptables。
Ⅲ 网维大师如何开启服务器热备功能
1.在主、副服务器都安装好的情况下,在客户机管理中,批量选中需要开启热备功能的客户机,然后点击右键=》修改。
注:必须有2台或2台以上系统虚拟盘服务器时,才能使用服务器热备功能。
2.在批量修改客户机界面中的右下角,勾选“启用热备服务器”即可。
Ⅳ 两台单独的服务器,配置完全一样,没有磁盘阵列,如何做双机热备
有磁盘阵列柜的话,可以使用系统自带的群集服务来做双机热备,系统需要是03或08server企业版的,如果没有磁盘阵列柜,那就需要使用双机热备软件来实现,软件需要额外购买,常用的如roseha。
Ⅳ 两台服务器,如何进行双机热备
双机主要分两种,一种是磁盘阵列柜的硬件双机热备;一种是没有磁盘阵列柜的纯软双机热备.如果没有磁盘阵列柜的话,只能做纯软双机,那你需要购买两个双机软件,才能做,一个是双机热备份软件:如ROSS或PLUS WELL等,别一个是双机镜像软件MirrorHA,
以ross为例:
1.纯软件双机热备份
两台服务器通过网络连接,硬件配置少了磁盘阵列 , 软件配置上,除了 Cluster 之外,新增了 NT Mirror , NT Mirror 是 ROSE 公司的网络数据镜像软件。
图 2 纯软件双机热备份系统
2 、 系统工作原理
与常规的双机系统相比,纯软件双机热备份系统的两台服务器之间少了公共的存储设备(通常是磁盘阵列),但是多了网络数据镜像软件 Mirror 。没有了公共存储设备磁盘阵列,对于某一个需要进行切换的服务而言,怎样保证其所用的数据在两台服务器上是一致的呢?这就是数据镜像软件 ROSE NT Mirror 的功能所在——— NT Mirror 通过网络,将某一台服务器上指定路径下的数据采用同步或异步方式,镜像到另一台服务器。
镜像软件取代双机热备份系统的磁盘阵列,关键之处在于其必须与 Cluster 软件协同工作。当某一服务运行于服务器 A 时,它所使用的特定数据在服务器 A 上对应于一个数据集合Ф A, 通过 NT Mirror 将源数据集Ф A 镜像到服务器 B 成为目标数据集Ф B, 当 NT Cluster 将该服务程序从服务器 A 切换到服务器 B 时,它使用服务器 B 上的数据Ф B, 同时 NT Mirror 自动修改原来从Ф A 到Ф B 的镜像成为从Ф B 到Ф A 的镜像。对一个服务程序是这样,对多个服务程序,则一一建立服务程序与数据镜像集之间的关系。这样,无论服务程序运行于哪一个服务器,始终保证其所使用的数据在对端服务器有一份镜像存在;当一台服务器由于硬件或软件原因发生故障失效 , 另外一台可在保证提供自己原有服务的同时 , 启动失效服务器的应用程序从而取代其服务器功能。
3 、运作方式:
在正常的运作情形之下,主机之间透过冗余侦测线路互相侦测,当任一主机有错误产生时, ROSE HA 提供严谨的判断与分析,确认主机出错之后,启动备援接管动作。
支持各种操作系统平台: Unix 、 Linux 、 Windows Server 等。
支持各种数据库: 数据库SQL 、 Oracle 、 Informix 、 Sysbase 、 Exchenge 、 Lotus/Nose 、 DB2 等
接管动作包括 :
文件系统 ( File System)
数据库 ( Database)
网络地址 ( IP Address)
应用程序 (AP)
系统环境 (OS)
容错备援运作过程
• 当一台活动服务器宕机时,其 IP 地址、服务器名称及运行的作业会自动转移至另一台服务器,客户端软件不需要重新设定,只要重新连结至原来的 IP 地址及服务器名称即可继续作业;
• 两台服务器的信息交换可通过: RS232 、 TCP/IP
• ROSE HA 采取高可靠的错误检测和故障恢复机制减少系统宕机,停机时间并防范错误,提供故障警告;
• ROSE HA 可设定故障排除后自动或手动回复 ( switch back );
• ROSE HA 安装时不需要修改操作系统的核心、更改应用软件,也无需特殊的硬件;
• ROSEHA 提供基于 GUI 的监控中心,管理员能查看 ROSE HA 的状态、检查错误信息和警告、修改系统参数及从远程工作站管理 ROSE HA 系统;
• 与数据库无关,可以支持各种数据库,包括 ORACLE 、 Sybase 、 Informix 等
管理工具:
• 友好、直观、易于操作的 GUI 界面
• 有关 ROSE HA 的配置都可以在 GUI 中完成,支持动态配置和实时同步
• 网卡的状态,磁盘的状态都可在 GUI 中显示出来
• 用户可通过第三方 Web 浏览器进行远程管理
监控的对象资源:
• Volume
• IP 地址
• 计算机别名
• 共享文件
• NT 服务
• 用户自定义
总之, ROSE HA 软件极大程度上减少了人的介入,提高了系统的可靠性与安全性,使服务能可靠的运行。
四、系统特点
纯软件高可用方案,是双机高可用软件和网络数据镜像软件的完美结合。可以概括如下:
• 系统成本低:不需要磁盘阵列,降低了系统成本。
• 系统抗灾难能力强。
• 构成双机系统的两台服务器通过网络连接,可以相隔很远的物理距离,增强了系统的抗灾难能力。
• 双向的失效切换功能。
• 双向的失效切换,又称 ACTIVE/ACTIVE 冗余方式,是指为用户提供两台可运行重要应用的全功能服务器 并确保它们中任何一台失效时另外一台可自动代替其功能。
• 系统资源占用少系统效率高。
• 数据镜像可以绑定到某一对网卡上完成,不占用服务器网络资源,减轻服务器负载,提高系统效率。
• 服务器无需相同。
• 双机热备份的两台服务器在硬件和软件配置上无须相同。
• 无需停机的设备维护能力。
• 由于应用程序可以在两台服务器之间自由切换,用户可由此实现在不停止网络服务前提下对其进行维护工作,如日常检查 . 维修或测试;而此时前台工作站可以完全透明地保持在工作状态。
• 简单易用功能全面的管理窗口。
• 面向对象的管理窗口使您只需移动鼠标,就可以配置和管理整个双机热备份系统。
• 从资源定义到服务程序的切换,都可以轻松完成。
系统要求:
• 两台服务器配置无需相同 ( IBM 服务器有例外)
• window NT/windows 2000 、 2003 操作系统版本一致
• 用于公用网络的网卡( Ethernet,Fast Ethernet,FDDI 或 ATM 卡 ) 用于私用网络的网卡或 RS-232 串口线
2.硬件双机热备份:可以用Win2003企业版也可以做.