交换机之间互连使用光电转化器出现的链路聚合故障

发布时间:  2016-12-19 浏览次数:  426 下载次数:  0
问题描述
拓扑图:

故障现象:

接到某客户单位报修,办公人员不能正常访问网络,不能访问Internet。经查看,发现是一台接入交换机上的部分办公人员网络不正常,连网关也不通。
处理过程
解决方法:
1、将故障的物理链路恢复,但是下次还是会出现同样的故障。

2、将链路聚合模式改成LACP模式,当上述情况发生时,SW1由于收不到对端的LACP报文,G0/0/1将被从聚合组中剔除,从而不再转发流量,所有流量将会从G0/0/2 转发。

根因
查看交换机之间互连端口及链路聚合的状态,发现两端链路聚合组成员接口的数量和状态不一致
(以下信息为模拟器上模拟)
SW1:
[sw1]dis trunkmembership eth-trunk 1
Trunk ID: 1
Used status: VALID
TYPE: ethernet
Working Mode : Normal
Number Of Ports in Trunk = 2
Number Of Up Ports in Trunk = 2
Operate status: up
Interface GigabitEthernet0/0/1, valid, operate up, weight=1
Interface GigabitEthernet0/0/2, valid, operate up, weight=1

[sw1]dis eth-trunk 1
Eth-Trunk1's state information is:
WorkingMode: NORMAL         Hash arithmetic: According to SIP-XOR-DIP        
Least Active-linknumber: 1  Max Bandwidth-affected-linknumber: 8             
Operate status: up          Number Of Up Port In Trunk: 2                    
--------------------------------------------------------------------------------
PortName                      Status      Weight
GigabitEthernet0/0/1          Up          1     
GigabitEthernet0/0/2          Up          1

SW2:
[sw2]dis trunkmembership eth-trunk 1
Trunk ID: 1
Used status: VALID
TYPE: ethernet
Working Mode : Normal
Number Of Ports in Trunk = 2
Number Of Up Ports in Trunk = 1
Operate status: up
Interface GigabitEthernet0/0/1, valid, operate down, weight=1
Interface GigabitEthernet0/0/2, valid, operate up, weight=1

[sw2]dis eth-trunk 1
Eth-Trunk1's state information is:
WorkingMode: NORMAL         Hash arithmetic: According to SIP-XOR-DIP        
Least Active-linknumber: 1  Max Bandwidth-affected-linknumber: 8             
Operate status: up          Number Of Up Port In Trunk: 1                    
--------------------------------------------------------------------------------
PortName                      Status      Weight
GigabitEthernet0/0/1          Down        1     
GigabitEthernet0/0/2          Up          1     

查看两端交换机链路聚合的配置模式均为手工负载分担(缺省是这种模式)
[sw1]dis cur interface eth1
#
interface Eth-Trunk1
port link-type trunk
port trunk allow-pass vlan 2 to 4094
#

[sw2]dis cur inter eth1
#
interface Eth-Trunk1
port link-type trunk
port trunk allow-pass vlan 2 to 4094
#

根据以上的状态及配置信息,可以分析出故障的原因如下:

SW1的G0/0/1与SW2的G0/0/1互连,SW1的G0/0/2与SW2的G0/0/2互连(此处假设SW2的G0/0/1和G0/0/2为光口),然后将2个接口分别加入了链路聚合组1。由于SW2的G0/0/1与光电转换器之间的链路故障,导致接口down,从聚合组中被剔除,但是SW1 的G0/0/1与光电转换器之间的链路是正常的,接口还是UP的,接口还是在聚合组1的成员接口列表中。因此,SW1链路聚合组根据负载分担的转发原则,一部分流量还是会通过G0/0/1进行转发,而由于对端链路的故障,这部分流量将到达光电转换器后被丢弃,不可达。

建议与总结
建议与总结:
1、在设备之间互连配置链路聚合的情况下,尽量避免使用光电转换器,否则容易出现上述故障。

2、如果两端设备都支持LACP协议,建议配置链路聚合时使用LACP模式,避免交换机不能感应对端设备接口的状态,从而导致流量错误的往不通的接口上转发。

3、链路聚合配置为 LACP模式时,还要考虑LACP接收的超时时间,因为在上述场景中,即使配置了LACP模式,网络中的部分流量还是会中断90秒(LACP缺省的接收超时时间为90秒)。如果对网络的要求比较高,可以通过命令将LACP接收的超时时间改小,减少故障发生的时间。

END