Radius down掉后造成MA5200F有大量的计费失败告警写入flash而导致cpu瞬高。

发布时间:  2012-07-26 浏览次数:  69 下载次数:  0
问题描述
操作MA5200F时出现瞬间停顿的情况,在退出后再telnet又可以操作。查看cpu,刚开始是80%左右,慢慢的回落,过会儿又再升高。
告警信息
处理过程
1.登陆设备,查看端口流量不大,查看端口统计信息,没有大量的广播包。查看告警,没有攻击的告警提示。查看cpu模块统计,sock模块的cpu暂用率只有2%。基本排除攻击的情况;
2.查看告警中有话单池满的告警,查看话单池信息,flash中还是有剩余空间。并且如果是真正的由于话单池满的情况导致的cpu高是不会时高时低的。另外也还没有本地计费的用户由于话单池满而导致的计费失败下线的情况,基本排除由于话单池满造成的cpu瞬高;
3.查看running-log,发现有大量实时计费失败的告警,disp trap里有认证、计费服务器中断(没有恢复)的告警,通过打开debug radius packet发现没有任何的计费回应code=5的报文,从而确定是radius中断。所以确定是由于radius down后,用户进行RADIUS计费失败,由于用户数比较多,有会大量的实时计费失败的运行日志产生,每隔一定时间缓存满后就会写入flash,在写入flash的时候导致cpu的增高。
根因
1.是否病毒攻击;
2.是否话单池满;
3.是否大量的日志或告警写入flash。

END