OceanStor5300V3(V300R003C00SPC100)ETH端口误码过多告警

发布时间:  2016-09-14 浏览次数:  162 下载次数:  0
问题描述

阵列侧出现告警,ETH端口误码过高。

告警信息

有,如下图是告警的具体信息:


处理过程

首先,根据告警内容确定端口ID,端口为CTE0.A.P0;其次,系统日志log_controller_XX_MAIN\Config,配置文件中查询对应的端口ID。本例中查询结果如下,可以看到端口有丢帧,端口IP为10.23.2.10,如图所示:


最后,在端口所属的控制器日志目录确认错帧类型为frame。本例中端口所属控制器0A控,在log_controller_0A\Other\ifconfig中查询端口IP 10.23.2.10,查询结果如下,所有错误统计都是frame,可以确认为frame丢帧,并且端口MTU值1500 bytes。如下图:


根因

阵列侧网卡发现收到的报文大于自身的MTU,直接丢弃,导致丢帧。

解决方案
排查与阵列告警的端口所连主机端口,确认主机端口MTU值是否大于阵列端口MTU值。查询方法如下:

Windows主机,通过网络适配器的配置信息,查看和修改网卡的MTU。Linux主机,可以通过ifconfig命令或者网卡配置文件来查看和修改网卡的MTU。如图所示:


检查出来如果主机端口MTU值大于阵列端口MTU,需要修改主机端口MTU,与阵列一致。注意修改主机端口MTU值时,会导致该端口到阵列的链路短暂不可用,在有客户业务的情况下,需要确保该主机有其他冗余端口备用;如果主机MTU值与阵列端口MTU一致,并不能完全证明主机不会下发超长帧。例如E9000主机MZ512卡设置为ISCSI模式后可能会定期发送超长帧,需要将MZ512网卡的工作模式设置为NIC模式。需要在主机发送端或者阵列接收端抓包分析确认报文大小。

最后,使用受限命令clear port bit_error清除端口误码后,观察是否继续增加。

建议与总结
在链路设置时,我们需要看一下存储端口的默认设置参数是否有改动,如MTU值等。

END