从SUN系统克隆盘恢复双机节点经验总结

2015-11-27

在维保服务工作中,经常会碰到双机环境中一个节点发生故障,实施恢复时需要考虑和分析各种情况,本文将介绍我在实际工作中的一个案例,供大家分享。

硬件介绍:

两台 SUN T5240 + EMC 磁阵

软件绍:Solaris 10 + sun cluster 3.1 u4 + emc powerpath

故障描述:

双机节点中一台设备系统崩溃无法启动,以下描述将宕机节点称为A,运行业务节点为 B

处理过程:

一、克隆系统硬盘有以下几种方式。

1、使用本地安装新硬盘方式进行克隆

2、使用网络方式进行克隆

3、克隆分区时:metadb 不用考虑,因为后续操作会重建 metadb 分区

实际操作时,我采用了第一种方式。

二、修改克隆盘配置文件,恢复宕机 A 节点的配置信息。

注意:操作以下内容,要注意操作对象,是克隆盘,而不是当前运行的系统盘,克隆盘的 S0 分区挂载到/mnt 目录下

1# vi /mnt/etc/hosts       

注意:恢复与 A 节点一致

2# vi /mnt/etc/hostname.*       

注意:所有已配置的网卡配置文件按 A 节点信息进行恢复

3# vi /mnt/etc/nodename        

注意:将主机名改为 A 节点的主机名

4# vi /mnt/etc/vfstab

:

#device device  mount   FS      fsck    mount   mount

       #to     mount   to      fsck            point           type    pass    at boot options

       #                       

       fd      -       /dev/fd fd      -       no      -

       /proc   -       /proc   proc    -       no      -

       /dev/md/dsk/d201  -       -       swap    -       no      -

       /dev/md/dsk/d200  /dev/md/rdsk/d200 /       ufs     1       no      -

       /dev/md/dsk/d207  /dev/md/rdsk/d207 /export/home    ufs     1       no      -

       /dev/md/dsk/d205  /dev/md/rdsk/d205 /zxme    ufs     2       yes     -

       /dev/md/dsk/d206  /dev/md/rdsk/d206 /global/.devices/node@2 ufs 2 no global

       /dev/md/zxmedg/dsk/d401 /dev/md/zxmedg/rdsk/d401 /zxme/data ufs 2 no -

修改后:

       #device device  mount   FS      fsck    mount   mount

       #to     mount   to      fsck            point           type    pass    at boot options

       #                      

       fd      -       /dev/fd fd      -       no      -

       /proc   -       /proc   proc    -       no      -

       /dev/dsk/c1t0d0s1  -       -       swap    -       no      -

       /dev/dsk/c1t0d0s0  /dev/rdsk/c1t0d0s0 /       ufs     1       no      -

       /dev/dsk/c1t0d0s7  /dev/rdsk/c1t0d0s7 /export/home    ufs     1       no      -

       /dev/dsk/c1t0d0s5  /dev/rdsk/c1t0d0s5 /zxme    ufs     2       yes     -

       /dev/dsk/c1t0d0s6  /dev/rdsk/c1t0d0s6 /global/.devices/node@1 ufs 2 no global

       /dev/md/zxmedg/dsk/d401 /dev/md/zxmedg/rdsk/d401 /zxme/data ufs 2 no -

5、# vi /mnt/etc/system

注意:因为克隆盘将以单盘方式引导,重建系统盘镜像,目的为了更改 SDS 卷名称

修改前:

* Begin MDD root info (do not edit)

rootdev:/pseudo/md@0:0,200,blk

* End MDD root info (do not edit)

修改后:

* Begin MDD root info (do not edit)

* rootdev:/pseudo/md@0:0,200,blk

* End MDD root info (do not edit)

6、# vi /etc/cluster/nodeid

修改前:(2是节点BID号)

2

修改后:(1是节点AID号)

1

7、修改 dump 设备

# cd /mnt/var/crash

# mv B A(BA分别是以主机名命名的目录)

8、修改 dump 目录

# vi /mnt/etc/dumpadm.conf

DUMPADM_DEVICE=/dev/dsk/c1t0d0s1


本网站由阿里云提供云计算及安全服务 Powered by CloudDream