接入交换机端口速率不匹配导致存储数据丢失

发布时间:  2014-09-12 浏览次数:  209 下载次数:  6
问题描述
存储设备端口出现告警,并有闪断现象,时间为1分钟

告警信息
 告警如附件所示
 
处理过程
1、接入交换机侧ping汇聚交换机可以ping通,并且未出现丢包现象,说明上连网络侧网络侧应该无问题
2、检查存储侧告警日志,发现网卡端口发生连接断开和连接上告警,告警日志如下
[2012-07-26 09:24:53]igb: eth2 NIC Link is Down
[2012-07-26 09:25:03]igb: eth2 NIC Link is Up 100 Mbps Full Duplex, Flow Control: None
[2012-07-26 09:25:12]igb: eth2 NIC Link is Down
[2012-07-26 09:25:22]igb: eth2 NIC Link is Up 100 Mbps Full Duplex, Flow Control: None
3、通过查看存储日志上分析该端口被协商成100Mbps,其他端口均为1000Mbps,说明出现问题应该是存储与交换机的网线连接可能出现问题,告警信息如下
Controller ID:B
        Interface Board ID:0
        Port ID: 3
        Link status:Link Up
        Status: Normal
        Type: Service GE
        Support data rate:10/100/1000Mbps
        Current data rate: 100Mbps
        Port Mode: 2
        Port Ip: 172.50.0.158
        Port Mask: 255.255.0.0
        Port Route:
        Error Number: 0
        Lost  Number: 0
        Over  Number: 0
        Time Stamp: Wed Jul  18 17:43:10 2012
通过历史日志分析看来,0/0/8端口一直被协商为100Mbps,如下所示
[2012-07-02 09:08:00]igb: eth2 NIC Link is Up 100 Mbps Full Duplex, Flow Control: None
[2012-07-02 09:08:01]igb: eth2 NIC Link is Down
4、将存储设备重启,仍然是100Mbps。最终确定就是连接网线出现问题。更换网线,检查链路状态,0/0/8被协商为1000Mbps,告警消失。



根因
1、存储侧出现问题,主要是存储设备上连交换机出现链路中断
2、接入交换机的端口出现问题,可能是接入交换机的端口与存储设备相连的接口速率不匹配,导致出现闪断现象

建议与总结

END