FAQ-如何通过日志查看误码

发布时间:  2014-10-15 浏览次数:  273 下载次数:  0
问题描述
如何通过日志查看误码?
解决方案
如果不能远程登录设备,只有收集日志并进行分析

1 SAS端口误码

SAS端口误码需要分析message日志。

1 首先通过事件日志Event.txt确定故障产生的具体时间:



2 查找对应日期的message日志,关键字:bit err overflow disable



以上打印就表示控制器phy5出现了过多误码导致被隔离。说明该段链路上有问题。

问题可能原因:
  • SAS级联线虚插。
  • SAS级联线被污染。
  • SAS级联线损坏。
处理建议:

1 首先查看事件信息,如果故障前出现过拔插SAS级联线的操作,则很可能是由于级联线虚插。

2 拔插级联线,并观察误码是否会继续出现。如果误码没有继续增加,说明是虚插导致的误码;如果误码仍然持续增加,需要更换SAS级联线。

3 如果现场有其他多余的SAS级联线,可以更换后继续观察;如果现场没有,请直接申请备件。

2 FC端口误码

由于FC环路的特性,可能出现多种误码特征。要详细分析FC误码的传播情况,需要确认组网方式,并通过SES日志确认误码的传播方向。在快速定位中,通常只需要关注SES日志即可。

关键字:HD

误码日志格式:HD:[端口号:LCV误码数:CRC误码数 ]

1. 硬盘误码

请查看硬盘篇误码部分。

2. 链路误码


说明:

从日志上看出1号框下行口(硬件定义27号PHY为下行口)(27)上出现误码,表示1号框(LED ID:1)的下行链路出现误码,需排查链路。SES日志中显示的是单边的误码情况,因此需要查看出现故障那边控制器的系统日志。

问题可能原因:
  • 光纤线接插问题
  • 光纤线故障
  • 光模块故障
处理建议:
  • 重新拔插光纤线并观察,如果没有误码继续产生即为接插问题。
  • 更换故障光纤线并观察,如果没有误码继续产生即为光纤线问题。
  • 更换下行口光模块并观察,如果没有误码继续产生即为下行口光模块问题。
  • 更换上行口光模块并观察,如果没有误码继续产生即为上行口光模块问题。



END