NE40E做DHCP SERVER时下挂Z厂家家庭网关无法获取地址问题处理

发布时间:  2012-07-27 浏览次数:  119 下载次数:  0
问题描述
NE40E采用版本V300R003C02B697,组网:NE40E--->T160G--->OLT--->ONU--->家庭网关。
家庭网关无法获取地址,但是PC在T160G、ONU下接入均可以正常获取地址。
告警信息
DHCP状态停留在OFFERED。
处理过程
1、经过测试在T160G、ONU下挂PC可以正常获取地址,并且可以ping通网关,排除二层通道和DHCP配置问题。
2、debug设备DHCP报文,发现收到了DHCPOFFER,也发出了DHCPOFFER,但是没有收到DHCPREQUEST等后续报文。原因可能有2点:NE40E发出了offer下行设备丢弃了;网关收到了
offer报文但是没回request。
3、通过在PC可以正常获取地址时抓包分析,DHCP之间报文交互没有问题。可能PC与家庭网关DHCP模块之间有差别。 
4、通过在T160G上行口和下行口镜像抓包,发现没有收到OFFER报文。怀疑NE40E主控板发出了OFFER报文,但是从接口没有转发出去。
5、在NE40E上查询DHCP地址池路由,发现有一条明细路由通过OSPF从上行学习到。把此段明细路由从地址池禁掉,发现所有DHCP状态正常。
6、经检查是因为部署VRRP时两端掩码不一致,对端小掩码发布过来。
7、经咨询公司NE40E接收到客户端的DHCP Discovery后,找到一个可用IP分配,同时根据DHCP Discovery应用层的boop flag字段,确定DHCP Offer回应报文为单播还是广播。现网上的家庭网关发送的bootp flag为0表示单播报文。NE40E构造DHCP Offer报文时走单播流程,目的IP为分配的可用IP,查找此IP的路由发现两条路由,根据最长匹配原则,Offer报文错误端口发送出去,导致客户端无法接收到回应报文,无法上线。PC的flag字段为广播报文,可以正常交互。
根因
1、二层网络不通。
2、NE40E DHCP数据配置错误。
3、各个设备DHCP报文交互异常。
4、中间设备上原因。
5、其他原因。 
 
建议与总结
1、部署时认真核对数据。
2、研发是否可以根据mac来处理报文转发。
3、通过抓包分析故障设备与正常设备报文差别。

END