数据库一体机上下电oracle服务启动失败

发布时间:  2015-03-10 浏览次数:  382 下载次数:  1
问题描述
Oracle数据库一体机环境,存储节点和DB节点整体上下电,上电后个别DB节点出现oracle服务异常,直接原因是ASM服务没扫到oracle应用的所有磁盘(这些磁盘通过FusionStorage提供)
处理过程
1:使用PuTTY登录对应DB节点

2:执行如下命令查询oracle的ASM磁盘:
/usr/sbin/oracleasm listdisks
查询得到类似:
[root@dsware1 ~]# /usr/sbin/oracleasm listdisks
DISK1
DISK10
DISK2
DISK3
DISK4
DISK5
DISK6
DISK7
DISK8
DISK9
[root@dsware1 ~]#

3:判断2中查询得到的ASM磁盘与配置ASM磁盘一致:
   是:则与当前故障无关,转为其它故障分析
   否:则执行4

4:执行如下命令重新扫oracle的ASM磁盘:
/usr/sbin/oracleasm scandisks

5:再次执行查询oracle的ASM磁盘:
/usr/sbin/oracleasm listdisks

6:判断5中查询得到的ASM磁盘与配置的ASM磁盘一致:
是:异常掉电问题解决,请执行7
否:则可能存储问题或oracle问题,请排查卷挂载信息是否正确后,排查完后再执行4
到6步,挂卷信息检查请执行:
/opt/dsware/agent/tool/lsscsi

7:检查oracle服务是否恢复正常
   是:问题解决
否:手工重启oracle服务或者重启OS然后再检查oracle服务。如果重启后数据库还不
能恢复正常则转为其它问题定位。
根因
整框掉电再上电场景OSD和VBS启动是无序的,由于可能个别节点存储节点上电时间比较长,导致卷的数据有些已经准备就绪有些还未准备就绪。VBS挂卷成功后虽然自动重启了oracle的oracleasm服务触发重新扫ASM盘,但被访问的卷此时可能存在某些数据还处于双副本故障状态,此时挂卷完毕后重启oracle的oracleasm服务触发扫ASM盘有可能扫不到盘,从而oracle服务异常、启动失败。

END