由于外置DHCP SERVER没有禁用giaddr导致ME60热备场景下挂业务异常

发布时间:  2013-02-07 浏览次数:  124 下载次数:  0
问题描述
1.故障现象:不同S8500下挂的的AP存在掉线情况
2.组网结构如下,两台ME60启用双机热备,AP作为DHCP客户端,ME60作为DHCP-Relay,AC作为DHCP SERVER,为解决不同BRAS下DHCP客户端续租报文的可达性问题,在两台BRAS上分别使用IP2和IP3作为giaddr(gateway ip addr),IP1作为该网段的网关IP。
 
处理过程
根据协议:DHCP RELAY收到业务端口发出的DHCP Client端广播报文后,如果“gateway ip addr”字段为0,则把该业务端口所在三层接口的主IP地址填入此字段,然后把此报文以单播方式发送给DHCP SERVER,由于两台ME60的网关地址一致,所以不能使用网关地址作为该字段发送给DHCP SERVER,需要重新指定gateway ip addr,且该地址不能再给客户端使用。


1.由于故障的AP分配在不同的S8500上,排除S8500故障问题;
2.登陆BRAS设备,查看设备配置,未发现问题;
3.根据组网结构,在DHCP SERVER(AC)上PING测两台ME60的giaddr(gateway ip addr)IP2和IP3,发现IP2能通,IP3不通;
4.在BRAS上查看IP3的路由,发现没有生成UNR路由(正常情况下,配置giaddr后就可以生成一条32位的UNR的主机路由),重新配置giaddr后可以生成一条32位的UNR的主机路由,操作如下:
display ip rout vpn-instance WLAN_SR_AC1 X.239.16.3 (IP3)
Route Flags: R - relay, D - download to fib
------------------------------------------------------------------------------
Routing Table : WLAN_SR_AC1
Summary Count : 1
Destination/Mask    Proto  Pre  Cost       Flags NextHop         Interface

   X.239.16.0/21  Unr    61   0            D   127.0.0.1       NULL0    //此处没有32位IP3的主机路由
[ME60-dhcp-server-group-hn-wlan-ac1-10]dis this
#
dhcp-server group hn-wlan-ac1-10
 dhcp-server X.141.177.97
 dhcp-server X.141.177.98
 dhcp-server giaddr ip-address X.239.16.3 vpn-instance WLAN_SR_AC1  //将此路由数据重新配置后可以生成主机路由
[ME60-dhcp-server-group-hn-wlan-ac1-10]display ip rout vpn-instance WLAN_SR_AC1 X.239.16.3
Route Flags: R - relay, D - download to fib
------------------------------------------------------------------------------
Routing Table : WLAN_SR_AC1
Summary Count : 1
Destination/Mask    Proto  Pre  Cost       Flags NextHop         Interface

    X.239.16.3/32  Unr    63   0            D   127.0.0.1       InLoopBack0

5.在BRAS上查看IP3的用户下线信息,发现DHCP SERVER把IP3分配给用户使用,信息如下,要求DHCP SERVER禁止分配IP2和IP3,观察正常。

display  aaa offline-record ip-address  IP3
  --------------------------------------------
  User name          : ME60@wlan-nms
  Domain name        : wlan-nms
  User MAC           : XXXX-XXXX-XXXX
  User access type   : IPoE
  User access interface: Eth-Trunk8.1333
  User access PeVlan/CeVlan    : 1432/0
  User IP address    : IP3
  User IPv6 address  : -
  User ID            : 97985
  User authen state  : Authened
  User acct state    : AcctReady
  User author state  : AuthorIdle
  User login time    : 2013-01-02 13:42:18
  User offline time  : 2013-01-02 13:52:56
  User offline reason: RUI request offline
  --------------------------------------------
  Are you sure to display some information?(y/n)[y]:y
  --------------------------------------------
  User name          : ME60@wlan-nms
  Domain name        : wlan-nms
  User MAC           : XXXX-XXXX-XXXX
  User access type   : IPoE
  User access interface: Eth-Trunk8.1333
  User access PeVlan/CeVlan    : 1432/0  
  User IP address    : IP3
  User IPv6 address  : -
  User ID            : 198315
  User authen state  : Authened
  User acct state    : AcctReady
  User author state  : AuthorIdle
  User login time    : 2013-01-02 12:59:33
  User offline time  : 2013-01-02 13:10:12
  User offline reason: RUI request offline
  --------------------------------------------

根因

主备设备上手动指定了dhcp-server giaddr ip-address ,但是没有将这些地址exclude,导致设备将此地址分配给用户使用。

解决方案

将giaddr 地址exclude掉。

建议与总结
解决此类问题,需要深入了解组网结构,深入了解相关协议细节。

END