CE6855-Lacp协商异常导致Eth-trunk成员端口故障处理;

发布时间:  2016-12-16 浏览次数:  274 下载次数:  2
问题描述

客户两台CE6855交换机堆叠,逻辑上是一台设备,服务器双归到这堆叠的CE6855,升级完版本,测试业务后发现异常,发现Eth-trunk捆绑口内有两个成员口一个端口的速率是10GE,一个端口的速率是100M因为升级前,槽位1为堆叠主,端口先UP,因此两端都以槽位1的端口进行协商,协商成select口进行数据转发。堆叠快速升级后,槽位2变为堆叠主,端口先UP,先被选为select端口。当槽位1升级成功端口UP后,LACP主端CE侧会重新选择槽位1的端口进行协商,变为select,但是服务器还是根据槽位2的端口进行协商,导致协商异常。槽位2端口shutdown后保持单链路工作恢复流量。

告警信息

处理过程

1. 通过命令dis ip interface brief,查看当前Eth-trunk的状态以及成员端口的状态;

2.通过命令display eth-trunk,查看当前该Eth-trunk下的成员端口的状态以及详细信息;


3.主端CE端的portstate状态,10GE1/0/43对应的是11111100,第4 bit1,表示为选中端口进行协商。从端服务器端10GE2/0/43portstate10110000,正常情况,第4 bit不应该为1,应该为0

4.因此,端口速率没有正常协商仅仅是触发,该问题需要独立定位,因为这个是两端协商的结果,可能是网线异常、或者是端口异常、网卡异常等。但是,端口速率异常不应该影响LACP协议的建立,需要从端服务器确认协商的过程并解决。


 

根因

堆叠快速升级后,槽位2100M变为堆叠主,端口先UP,先被选为select端口。当槽位110G升级成功端口UP后,LACP主端CE侧会重新选择槽位1的端口进行协商,变为select,但是服务器还是根据槽位2的端口进行协商,导致协商异常。

解决方案

手动将两个成员口shutdown,然后首先打开10GE的端口,让其为select口;然后打开100M的端口,10GE的端口变为select口,1GE的端口成unselect,业务正常。

建议与总结

1.升级版本前或者重启下,需要统计好服务器出现单挂的现象,跟客户进行确认,升级完或者重启后进行故障规避,就是手动两个成员口shutdown,然后首先打开速率大的端口,让其为select口;然后打开速率小的端口

2.根本上解决问题,就是检查光模块以及光纤是否正常,如发现异常,及时更换,避免影响业务。

END