‘壹’ IBM小型机宕机了,怎么改成分区启动
bootlist 是AIX的命令,常用作操作系统启动的磁盘顺序设定和查看。
而分区一般是指LPAR,相当于虚拟机本身,和bootlist是两码事。
分区的启动一般是在HMC管理中设置和实现,或者相应管理软件中设置。
问题所说的宕机了,是单个分区宕了,还是整台物理机宕机了,不明确不好判断。
‘贰’ IBM AIX小型机上面如何开启SNMP服务
停止系统的snmpd进程 用管理员用户登陆,执行如下命令查看snmpd是否运行:lssrc -s snmpd(dpid2,hostmibd,snmpmibd,aixmibd)若有,则执行如下命令停止:stopsrc -s snmpd(dpid2,hostmibd,snmpmibd,aixmibd)进入/etc目录,用vi依次编辑rc.tcpip文件,按“i”键进入编辑模式,注释掉所有snmpd(dpid2,hostmibd,snmpmibd,aixmibd)的行,依次按”ESC” --> “:” --> “w” --> “q”后回车,完成配置。安装Net-Snmp 在安装Net-Snmp之前,要确保系统中安装有gcc(C的编译环境),如果没有,请按照如下步骤安装gcc:1 到 http://aixpdslib.seas.ucla.e/packages/gcc.html页面下载aix对应版本的gcc二进制版本 (以gcc 4.0.2为例)2 使用ftp上传到aix系统中(以/tmp目录为例)3 解压:uncompress gcc.4.0.2.tar.Ztar xvf gcc.4.0.2.tar4 设置路径:export PATH=/tmp/usr/local/bin:$PATH至此,gcc安装完毕。使用ftp上传net-snmp-5.1.2.tar.gz文件和net-snmp-5[1].1.2-AIX-patch-20051202.diff补丁文件用管理员用户登陆,在文件上传的目录,执行如下命令解压:gzip -d net-snmp-5.1.2.tar.gztar xvf net-snmp.5.1.2.tar在当前目录会出现net-snmp-5.1.2的目录,进入此目录cd net-snmp.5.1.2打补丁patch -p1 < ../net-snmp-5[1].1.2-AIX-patch-20051202.diff配置./configure --disable-applications --disable-manuals --disable-snmptrapd-subagent \ --disable-shared --with-mib-moles="host" --with-out-mib-moles="mibII"编译make安装make install配置Net-Snmp 使用vi编辑配置文件:vi /usr/local/share/snmp/snmpd.conf 按“i”键进入输入模式,输入如下内容:rocommunity publicrwcommunity private依次按”ESC” --> “:” --> “w” --> “q”后回车,完成配置。运行Net-Snmp 运行如下命令启动Net-Snmp:/usr/local/sbin/snmpd &配置启动服务 使用vi编辑配置文件:vi /etc/rc.tcpip 按“i”键进入输入模式,输入如下内容:/usr/local/sbin/snmpdps -ef | grep local | grep -q snmpdif [ $? -eq 0 ]; thenecho “NET-SNMP snmpd is running.”elseecho “NET-SNMP snmpd is failed to start.”fi依次按”ESC” --> “:” --> “w” --> “q”后回车,完成配置。
‘叁’ IBM小型机的关机命令是什么谁有相关命令大全啊
shutdown -h now
‘肆’ 如何查看IBM的AIX小型机的存储空间有多大
如果你指的是主机硬盘或者挂载磁盘的大小,可以用下面这个命令:
lscfg -vp|grep hdisk
如果指的是vg的空间大小,可以使用lsvg命令,例如:
lsvg rootvg //这个需要稍微计算一下
如果指的是文件系统的大小,可以使用df或者命令,例如:
df -g
‘伍’ Linux中常用的命令都是那些单词的缩写
操作类Unix系统的时候,如果你见过真正的小型机,很多概念就容易理解的多。
‘陆’ 如何检查AIX小型机磁盘状态包括正常和非正常的状态,如何检查AIX外置的磁盘状态
简单的命令是lspv hdiskX,会有PV STATE显示,active是正常,另外lsvg -l vgname也可以看出,里面不能有stale pps,外置磁盘那就要看是什么型号的盘阵,型号有IBM、EMC、HDS还有国产的,这个就没法笼统说了
‘柒’ AIX小型机服务器巡检操作
1、机器型号
# uname -uM
IBM,7029-6E3 IBM,01100550A
2、检查系统硬件设备故障灯是否有亮
3、系统错误报告
# errpt -d H -T PERM //硬件的错误报告
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
BFE4C025 0530085308 P H sysplanar0 UNDETERMINED ERROR
BFE4C025 0529091308 P H sysplanar0 UNDETERMINED ERROR
# errpt -d S -T PERM //软件的错误报告
# errpt -aj *******|more //具体的错误信息
# errpt -d H -T PERM>/tmp/hwerror.log //可以把错误的报告存成一个文件
4、有否给 root 用户的错误报告
# mail
Mail [5.2 UCB] [AIX 5.X] Type ? for help.
"/var/spool/mail/root": 5 messages 3 new 5 unread
U 1 root Thu May 15 09:53 24/884 "diagela message from p615"
U 2 root Fri May 16 04:07 24/884 "diagela message from p615"
>N 3 root Sat May 24 13:08 23/874 "diagela message from p615"
5、检查 hacmp.out, smit.log, bootlog 等
# lssrc -g cluster/#>lssrc -g cluster
Subsystem Group PID Status
clstrmgrES cluster 16334 active
一般上 hacmp.out 的位置: /usr/sbin/cluster/ 或者 /tmp/
然后找到最近的 hacmp.out 文件,察看有没有错误信息
6、文件系统检查
# df -k
Filesystem 1024-blocks Free %Used Iused %Iused Mounted on
/dev/hd4 131072 101568 23% 2268 4% /
/dev/hd2 1441792 31256 98% 36056 11% /usr
/dev/hd9var 131072 117048 11% 418 2% /var
看看有没有超过 90% 使用率的,建议用户改善
7、逻辑卷有否 "stale" 的状态
# lsvg -l rootvg
LV NAME TYPE LPs PPs PVs LV STATE MOUNT POINT
hd5 boot 1 1 1 closed/syncd N/A
hd6 paging 4 4 1 open/syncd N/A
hd8 jfslog 1 1 1 open/syncd N/A
hd4 jfs 1 1 1 open/syncd /
hd2 jfs 11 11 1 open/syncd /usr
hd9var jfs 1 1 1 open/syncd /var
如果系统还有其他卷组,也需要察看
8、内存交换区的使用率是否超过 70%
# lsps -a
Page Space Physical Volume Volume Group Size %Used Active Auto Type
hd6 hdisk0 rootvg 512MB 1 yes yes lv
9、系统性能是否有瓶颈
# topas
# vmstat 1 10
kthr memory page faults cpu
----- ----------- ------------------------ ------------ -----------
r b avm fre re pi po fr sr cy in sy cs us sy id wa
0 0 110029 408618 0 0 0 0 0 0 4 602 75 0 1 99 0
0 0 110031 408616 0 0 0 0 0 0 1 562 54 1 0 99 0
0 0 110031 408616 0 0 0 0 0 0 3 628 84 0 0 99 0
# iostat 1 10
tty: tin tout avg-cpu: % user % sys % idle % iowait
0.0 394.0 0.0 0.0 100.0 0.0
Disks: % tm_act Kbps tps Kb_read Kb_wrtn
hdisk0 0.0 0.0 0.0 0 0
hdisk1 0.0 0.0 0.0 0 0
cd0 0.0 0.0 0.0 0 0
10、网络与通讯检查
# ifconfig -a
# netstat -in
Name Mtu Network Address Ipkts Ierrs Opkts Oerrs Coll
en0 1500 link#2 0.9.6b.3e.6.ac 1964 0 534 0 0
en0 1500 192.168.0 192.168.0.11 1964 0 534 0 0
lo0 16896 link#1 267 0 413 0 0
lo0 16896 127 127.0.0.1 267 0 413 0 0
# netstat -rn //察看路由情况
Routing tables
Destination Gateway Flags Refs Use If Exp Groups
Route Tree for Protocol Family 2 (Internet):
127/8 127.0.0.1 U 7 142 lo0 - -
192.168.0.0 192.168.0.11 UHSb 0 0 en0 - - =>
# vi /etc/hosts //察看 hosts 文件有否特殊的定义
# ping ****
#lsattr -El inet0 //路由的检测
authm 65536 Authentication Methods True
hostname h24 Host Name True
gateway Gateway True
route net,,0,172.16.23.81 Route True
bootup_option no Serial Optical Network Interface True
rout6 FDDI Network Interface True
11、有否符合要求的系统备份
第一次去可以先询问客户关于备份的策略
# ls -l /image.data //看看系统有没有备份的 image 文件,记录最后备份日期
-rw-r--r-- 1 root system 9600 May 19 17:31 /image.data
# lsvg -l rootvg //察看有否符合要求的数据备份和保护
LV NAME TYPE LPs PPs PVs LV STATE MOUNT POINT
hd4 jfs 1 1 1 open/syncd /
hd2 jfs 11 11 1 open/syncd /usr
hd10opt jfs 1 1 1 open/syncd /opt
oraclelv jfs2 80 160 1 open/syncd /oracle
loglv00 jfs2log 1 1 1 open/syncd N/A
testlv jfs 10 20 1 closed/syncd /tmp/test
如何察看数据保护方式 RAID10/RAID5,RAID 的Hotspare 属性是否打开
#smitty ssaraid? Change/Show Attributes of an SSA RAID Array
检查Enable Use of Hot Spares属性是否为YES
12、系统 Dump 设置是否正确
# sysmpdev -l
primary /dev/hd6
secondary /dev/sysmpnull
directory /var/adm/ras
forced flag TRUE
always allow mp FALSE
mp compression OFF
# sysmpdev P p /dev/hd6 s /dev/sysmpnull
# sysmpdev -P -c
13、HACMP 测试
# /usr/sbin/cluster/diag/clconfig -v '-tr' // Cluster Verification 输出结果无Fail
# /lssrc -g cluster
14、maxpout, minpout 系统参数
如果系统中运行了HACMP
smitty chgsysy,将High/Low water mark从0/0修改为33/24
# lsattr -El sys0|grep maxpout
//maxpout 用途: 对文件指定未决 I/O 的最大数目
值: 缺省值:0(不检查);范围:0 到 n(n 应该是 4 的倍数加 1)
# lsattr -El sys0|grep minpout
//指定一个基点,在该基点处,已达到 maxpout 的程序可以继续写入文件
值: 缺省值:0(不检查);范围:0 到 n(n 应该是 4 的倍数,且大于或等于 4 小于 maxpout)
15、syncd 参数
# grep syncd /sbin/rc.boot //sync() 被 syncd 调用的间隔时间
nohup /usr/sbin/syncd 10 > /dev/null 2>&1 &
值: 缺省值:60;范围:1 到任何正整数
显示: grep syncd /sbin/rc.boot 或 vi /sbin/rc.boot
更改: 更改在下次引导后有效,而且是永久有效。备用方法是使用命令 kill 来终止守护程序
syncd 并用命令 /usr/sbin/syncd interval 从命令行重新启动它。
诊断: 当 syncd 正在运行时,文件的 I/O 被阻塞了。
调整: 在缺省级别上,这个参数几乎不影响性能。不推荐对这个参数进行更改。为了保持数据完整
性对于 HACMP而使 syncd interval 明显缩小,会导致性能下降。
更改命令为:
#vi /sbin/rc.boot
16、aio 参数 //异步 I/O 可调参数
# lsdev -C|grep aio
察看状态是否是 available
# lsattr -El aio0
minservers 1 MINIMUM number of servers True
maxservers 10 MAXIMUM number of servers True
maxreqs 4096 Maximum number of REQUESTS True
kprocprio 39 Server PRIORITY True
autoconfig available STATE to be configured at system restart True
fastpath enable State of fast path True
# smit aio //可以更改参数
17、检查 errdaemon, srcmstr 是否正常运行
# ps -ef|grep err
# ps -ef|grep src
18、 系统硬件诊断
# diag
-> Diagnostic Routines
-> System Verification
-> All Resources
-> F7 或者 Esc+7
19、补丁程序 PTF 是否满足要求,当前系统补丁版本
#oslevel -r
5300-04
#instfix -i|grep
All filesets for 5.3.0.0_AIX_ML were found.
All filesets for 5300-01_AIX_ML were found.
All filesets for 5300-02_AIX_ML were found.
All filesets for 5300-03_AIX_ML were found.
All filesets for 5300-04_AIX_ML were found.
All filesets for 5300-05_AIX_ML were found.
# lscfg -vp //检查所有设备的微码
20、收集系统信息放到/tmp/ibmsupt
# snap -ac //运行#snap -ac,生成文件snap+s/n.pax.Z