S5500 V3设备频繁报告FC链路断开告警的处理方法

发布时间:  2015-08-20 浏览次数:  243 下载次数:  0
问题描述
在存储的设备管理页面中,可以看到很多FC链路断开的告警,告警对象来自双控;告警内容类似“The FC host port (Controller Enclosure CTE0, -- controller B, port number H1) is disconnected”, 而且这些告警基本上会在一分钟内自动清除。
告警信息

查看日志中的时间列表,可以看到如下的告警:

处理过程

1、首先在设备管理页面收集系统日志和运行日志

2、根据告警发生的时间点,查看message日志,在告警发生之前, 可以看到日志中有很多与PCIE及IOC相关的打印,可以查找关键字“UNF_ReportPciErr”和“IOC_FwIntrHandler”。

与PCIE相关的打印相对较少,如下:



与IOC相关的打印则比较多,如下(只摘取其中少部分):

根因
通过运行数据及配置文件,可以看到当前的设备版本是V300R002C10SPC100。其中的IOC芯片偶尔会从内部寄存器中接收到非法的值,为了不影响业务通信,FC驱动就会重置该接口。

END