USG9100黑名单问题定位方法

发布时间:  2012-07-18 浏览次数:  51 下载次数:  0
问题描述

黑名单的主要问题大多集中在黑名单的同步上,有如下几种现象可以

检测出黑名单没有同步:

1 通过display fire blacklist item 发现表头显示的总数与

  黑名单实际列出的个数不一致。

2 通过 display fire blacklist item slot 5 cpu 0 

  和display fire blacklist item slot 5 cpu 1,发现同一块业务板的主从cpu黑名单没有同步。

3 通过display fire blacklist item slot 5 cpu 0

   和display fire blacklist item slot 3 cpu 0 发现不同业务板上的黑名单没有同步。

4 双机热备的情况下发现备机业务板上的黑名单与主机业务板上的黑名单不同步。

告警信息
处理过程

针对以上问题有如下解决方法:

1 查找出ipc堵塞的原因。一般情况下通过ipc下发黑名单速率不是很快,因此很少有可能是黑名单原因堵塞通道,这个时候就需要查找是其余哪些模块堵塞通道,解决好了黑名单就自然好同步了。

2 业务板的黑名单同步很快,因此很容易产生因黑名单申请smbuf导致smbuf不够,而出现同步问题,同时也会影响其余模块的申请。

因此黑名单的建立不能太快,需要做出限速。

3 undo次数太过频繁,会导致加入黑名单与删除黑名单之间因各业务板间的时延而误删或加入本来该删掉的。限制undo之间的间隔,如像接口undo之间的间隔15s。

4 这个本身不是问题,因为备机没有这样的vpn时候,就不该在该vpn上建立黑名单。想要完全一致,需要主备机上有一样的vpn。

5 通过报文跟踪,丢包统计等分析丢包原因和位置,进而解决问题。

根因

1 IPC通道堵塞,由于主控板会通过ipc通道下发黑名单到各个业务板,如果通道堵塞,会导致有的业务板收到增加黑名单的消息,有的业务板无法收到,因此不能同步。

2 smbuf不够。业务板产生的黑名单直接通过数据面同步,在此期间需要申请smbuf来存储信息,如果申请失败,肯定会导致黑名单无法同步。

3 undo次数过于频繁,新加入的黑名单正在同步,而有的业务板正在删除,导致有的业务板先加入被删除,后加入的没有被删除,出现因时延引起的同步问题。

4 双机热备下主机上建立的vpn,备机上没有对应的vpn。导致同步过来的黑名单无法加入。

5 其它原因超成同步信息丢失,比如双机热备中黑名单同步信息丢失,底层驱动一些收发包出现问题等。

建议与总结

END