VTL6900虚拟带库挂载磁带失败导致备份软件策略无法正常执行

发布时间:  2015-06-15 浏览次数:  576 下载次数:  12
问题描述

现网采用CS/MA合一部署在一台windows 2012服务器上。使用CommVault软件备份4个oracle数据库实例,备份介质采用华为VTL6900设备,创建一个scalar 100虚拟带库设备提供给备份客户端使用。

VTL6900异常下电后,虚拟带库设备故障,无法挂载磁带,导致第三方备份软件CommVault备份策略无法正常执行。

告警信息

第三方CommVault软件Event Viewer显示备份策略执行不成功。

处理过程

1、  查看CommVault控制器的Event Viewer,出现如下重要警告:

      Critical           1237       98           06/03/2015     Oracle reported the following error: ORA-12541: TNS: no listener.

      Critical           1286       98           06/03/2015   Failed to mount media with barcode [0003002A], side [A_123], into drive [IBM ULTRIUM-TD1_7], in

      library [ADIC Scalar 100 2] on MediaAgent [win-1ddagr828r3].  SCSI Operation: Write OML. Reason: Device did not respond to the command in a timely

      manner. Advice: If this error is persistent, check if there are any visible hardware errors reported by the device or Operating System logs. Please contact

      your hardware vendor.

      可以看出两个问题

1)  备份Oracle RAC数据库时,提示ORA-12541: TNS: no listener 要在CommCell中检查该oracle RAC两个实例是否都是open状态;另外还需要到oracle主机上检查listener状态。检查oracleRAC两个实例状态open状态,oracle主机上检查listener状态也是正常的。

 

      

       2)  JobID 98,一直在尝试mount磁带,但是都会提示Reason: Device did not respond to the command in a timely manner.  应该是

           磁带库和MA win-1ddagr828r3 之间有些硬件问题。

A.      先检查这台widnows机器上磁带机和HBA卡驱动程序版本(建议升级到最新)。确认磁带机与HBA卡正常。

B.      尝试重启这台Widnows机器,让OS重新认一次磁带库设备。再次执行备份任务,仍然报错。

C.      进行备份小文件到磁带库,同样无法成功。

2、重启VTL6900

      (1) 使用SSH登陆VTL,使用init 0关闭VTL服务器。再重启VTL服务器。

      (2) cs服务器的操作系统上进行一次硬件扫描以检测可能的设备更改。扫描成功

      (3)在备份软件界面,选中磁带库,右键Reset Libnrary

            

          (4) 进行小文件备份测试,仍然失败。提示无法找到磁带,任务结果如下

               


 

3、配置VTL6900 SAN客户端只使用一个WWPN

          (1)从VTL Console里展开“SAN客户端”-<客户端名称>-“光纤通道”右键属性,取消一个WWPN的选择。

          (2)在cs服务器的操作系统上进行一次硬件扫描

          (3)在备份软件里重新扫描一次设备,更新设备信息

          (4)进行文件备份测试。仍然失败。任务结果同上图。

4、使用ArmTool工具测试带库

          (1)在CS服务器上,通过Simpana自带的Process Manager停止备份软件服务

          (2)启动armtool工具。以管理员身份打开command line,进入CommVault目录,打开armtool工具

          


         

       (3) 开始使用armtool工具测试

            a) 回车确认进入armtool工具

            
             b) 回车选择虚拟带库设备

            
             c) 4回车选择设置驱动

            


 

             d1回车选择驱动01

            


 

             e) 2回车改变目标槽位

            

             f) 显示数据按Slot/Label排列。输入一个Label<EMPTY>项所对应的Slot值回车。

            

             g) 3回车选择卸载磁带。

            


 

             h) 0回车回到主菜单。

            


 

            i) 5回车选择挂载磁带。

            

             j) 1回车改变源槽位

            

             k) 显示数据按Slot/Label排列。输入一个Label不为<EMPTY>项所对应的Slot值回车。

            

            l) 2回车改变目的驱动。

            


 

             m) 1回车选择驱动01

            

            n)3回车选择挂载磁带。

            

            o) 查看测试结果:

            

                    测试结果显示挂载磁带成功。

             (4)进行小文件备份测试。仍然不成功。

 

5、创建一个新的带库进行测试。

            (1)通过VTL Console新建一个虚拟带库,带库类型选择ADIC Scalar i500,驱动器选择ULTRIUM-TD2,添加2盘磁带用于测试。

                  

                  


 

            

        ( 2)通过VTL Console新建一个SAN客户端,在分配客户端启动器WWPN号时仅选择CS服务器上的一个WWPN;再将新创建的带   库分配给该客户端

       

    

       (3)在CS的操作系统的设备管理器里扫描新硬件,确认已发现新创建的带库

       (4)在备份软件里添加新创建的带库,并为其创建一个存储策略

       (5)修改文件备份任务使用新创建的存储策略,然后进行文件备份测试。测试成功

 

6、将备份策略介质变更为新的磁带库

   根据上述测试,确定旧磁带库因异常下电出现故障,导致备份软件无法成功执行备份策略。

   新带库测试成功后,需将备份策略介质改变为新的磁带库。并未新磁带库添加更多的磁带。



 


 

 

根因

VTL6900设备异常下电,导致其上的一个虚拟带库设备异常,无法加载磁带


建议与总结

1、  对备份策略无法正常执行的情况,首先要确认问题出在哪里。主要是下面三个方面;

1)  备份客户端;

2)  备份数据库;

3)  备份介质。

2、  在进行备份介质测试过程中,使用小文件备份测试来检查测试结果比较方便。

END