AR路由器 维护宝典
硬件故障案例
网口对接不能UP
介绍网口对接不能UP的典型案例。
故障现象
网口连接后,端口指示灯不亮,物理层或协议层不能UP,或者两层都不能UP。
可能原因
- 网线有问题。
- 网口配置问题。
- 运营商线路问题。
- 对接RJ45端口为非以太网端口。
故障处理步骤
- 更换一根确认为好的网线,重新对接端口。
- 查看网线两端对接设备网口配置(端口速率,是否双工,是否自动协商等)是否一致。
以GE0口为例,在GE0接口两端都执行如下命令,查询AR侧网口配置:
[Huawei-GigabitEthernet0/0/0]display this interface
显示的信息如下所示,如果接口两端的属性一致,则故障已解决;如果接口两端的属性不一致,则继续以下步骤。GigabitEthernet0/0/0 current state : DOWN Line protocol current state : DOWN Description:HUAWEI, AR Series, GigabitEthernet0/0/0 Interface Route Port,The Maximum Transmit Unit is 1500 Internet Address is 192.168.1.29/24 IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 5489-9875-4a0b Last physical up time : - Last physical down time : 2011-09-28 09:51:56 Current system time: 2011-09-28 13:52:21 Port Mode: COMMON COPPER Speed : 1000, Loopback: NONE Duplex: FULL, Negotiation: ENABLE Mdi : AUTO Last 300 seconds input rate 0 bits/sec, 0 packets/sec Last 300 seconds output rate 0 bits/sec, 0 packets/sec Input peak rate 0 bits/sec,Record time: - Output peak rate 0 bits/sec,Record time: - Input: 0 packets, 0 bytes Unicast: 0, Multicast: 0 Broadcast: 0, Jumbo: 0 Discard: 0, Total Error: 0 CRC: 0, Giants: 0 Jabbers: 0, Throttles: 0 Runts: 0, Alignments: 0 Symbols: 0, Ignoreds: 0 Frames: 0 Output: 0 packets, 0 bytes Unicast: 0, Multicast: 0 Broadcast: 0, Jumbo: 0 Discard: 0, Total Error: 0 Collisions: 0, ExcessiveCollisions: 0 Late Collisions: 0, Deferreds: 0 Buffers Purged: 0 Input bandwidth utilization threshold : 100.00% Output bandwidth utilization threshold: 100.00% Input bandwidth utilization : 0% Output bandwidth utilization : 0%
- 联系相应运营商检测线路。
- 确认与AR网口对接RJ45端口是否为以太网口,如果不是,将网线插入以太网口重试。
RJ45为通用接口,使用者可以根据需要将PIN脚定义成不同的功能,有些管脚甚至被定义为电源和地。网口连接时一定要确认网线插入的口为以太网口,否则插错接口很容易导致端口损坏。插入网线后,输入以下命令对以太网口连接电缆进行检测。
[Huawei-GigabitEthernet0/0/0]virtual-cable-test
当显示如下信息时,请结合表17-1和下面信息内容定位出故障的位置。
Warning: The command will stop service for a while, continue [Y/N]?y Sep 28 2011 13:57:54+00:00 Huawei %%01IFPDT/4/VCT(l)[13]:The user choose YES when there is a selection about whether to run VCT. [Huawei-GigabitEthernet0/0/0] Sep 28 2011 13:57:57+00:00 Huawei %%01IFPDT/4/IF_STATE(l)[14]:Interface GigabitEthernet0/0/0 has turned into DOWN state. [Huawei-GigabitEthernet0/0/0] Sep 28 2011 13:57:57+00:00 Huawei %%01IFNET/4/LINK_STATE(l)[15]:The line protocol IP on the interface GigabitEthernet0/0/0 has enter ed the DOWN state. [Huawei-GigabitEthernet0/0/0] Pair A length: 0 meter(s) Pair B length: 0 meter(s) Pair C length: 0 meter(s) Pair D length: 0 meter(s) Pair A state: Ok Pair B state: Ok Pair C state: Ok Pair D state: Ok
表17-1 virtual-cable-test命令输出信息描述项目
描述
pair a/b/c/d
表示电缆的4对线。
Pair A length
电缆长度:
- 有故障时为接口到故障位置的长度。
- 无故障时为电缆的实际长度。
- 未接电缆时为默认长度0m。
Pair A state
网线状态:
- Ok(正常):表示线对(PAIR)正常终结。
- Open(开路):表示线对开路。
- Short(短路):表示线对短路。
- Crosstalk(串扰):表示线对之间有串音(相互有干扰)。
- Unknown(未知):其他未知故障原因。
通过如上步骤的排查,可以自动过滤解决大部分的网口不up问题。
SA端口对接不能UP
介绍SA端口对接不能UP的典型案例。
故障现象
SA单板物理端口和Protocol都不能UP。
Serial1/0/0 current state : DOWN Line protocol current state : DOWN Description:HUAWEI, AR Series, Serial1/0/0 Interface Route Port,The Maximum Transmit Unit is 1500, Hold timer is 10(sec) Internet Address is 172.20.18.22/30 Link layer protocol is nonstandard HDLC Last physical up time : 2012-08-09 16:04:29 Last physical down time : 2012-08-09 16:04:29 Current system time: 2012-08-09 16:32:47 Physical layer is synchronous, Virtualbaudrate is 64000 bps Interface is DTE, Cable type is V24, Clock mode is TC Last 300 seconds input rate 0 bytes/sec 0 bits/sec 0 packets/sec Last 300 seconds output rate 0 bytes/sec 0 bits/sec 0 packets/sec
可能原因
SA接口对接两端设备时钟相位不一致。
故障处理步骤
- 当对端没有收到信号时,执行以下命令,配置翻转同步方式下Serial 接口的发送时钟信号。
[Huawei-Serial1/0/0]invert transmit-clock
- 当本端没有接收到信号时执行以下命令,配置翻转同步方式下Serial 接口的接收时钟信号。
[Huawei-Serial1/0/0]invert receive-clock
- 只能在AR3200 作为DTE 设备时配置翻转同步方式下Serial 接口的时钟信号。
- 通过如上步骤的排查,可以自动过滤解决大部分的SA端口不up问题。
G.SHDSL端口常见对接问题
介绍G.SHDSL端口常见对接问题的典型案例。
故障现象
G.SHDSL端口长时间不激活或者端口反复UP/DOWN。
可能原因
- G.SHDSL线路上使用了ADSL/VDSL使用的分离器。
- 使用的G.SHDSL线缆非配套发货线缆。
- 对端的DSLAM使用了较老的G.SHDSL芯片。
- G.SHDSL线路经过路径存在电磁干扰源,如电动机、变压器、发电机等。
故障处理步骤
- 检查线路上是否使用ADSL/VDSL分离器。
- 检查使用的线缆是否AR G.SHDSL配套线缆。AR配套线缆如图17-2所示。
- 如果故障未得到解决,请执行以下命令,配置G.SHDSL上行接口的兼容性模式:
[Huawei-Atm0/0/0]shutdown [Huawei-Atm0/0/0]shdsl capability g-shdsl.bis [Huawei-Atm0/0/0]shdsl compatibility pmms normal vendor gs enhanced filter normal [Huawei-Atm0/0/0]undo shutdown
如果故障仍然存在,请继续执行以下命令。
[Huawei-Atm0/0/0]shutdown [Huawei-Atm0/0/0]shdsl compatibility pmms long vendornormal filter normal [Huawei-Atm0/0/0]undo shutdown
- 将G.SHDSL线路同电磁干扰源分离开,尽量远离。
通过如上步骤的排查,可以自动过滤解决大部分的G.SHDSL端口常见对接问题。
ADSL/VDSL端口常见对接问题
介绍ADSL/VDSL端口常见对接问题的典型案例。
故障现象
ADSL/VDSL端口不能激活。
可能原因
- 连接ADSL/VDSL端口的线路存在问题。
- AR端和DSLAM端ADSL/VDSL配置不一致。
- XDSL线路经过路径存在电磁干扰源,如电动机、变压器、发电机等。
- XDSL 互通问题。
故障处理步骤
- 排查连接AR XDSL端口的线缆,同时可通知运营商检测下该线路是否有问题。
- 如果AR单板上只有一个 ADSL/VDSL端口,则此时需要与营运商确认下对端的DSLAM上是否配置了Bonding。
- 将XDSL线路同电磁干扰源分离开,尽量远离。
- 如果故障仍然无法解决,请与华为技术有限公司售后服务工程师联系,确认是否为IOP互通问题。
通过如上步骤的排查,可以自动过滤解决大部分的ADSL/VDSL端口常见对接问题。
DSP无法正常工作
介绍DSP无法正常工作的典型案例。
故障现象
语音业务配置后,系统播放忙音,不能播放拨号音。
可能原因
- 系统中未插入/未插好DSP DIMM条。
- 系统未安装语音license文件。
故障处理步骤
- 系统断电,插入DSP DIMM条,重新启动系统。
- AR1220W可以使用display voice dsp state 0/0 命令查看DSP条状态。
- AR2220/AR2240/AR3260可以使用display voice dsp-dimm state 0/0 命令查看DSP条状态。对于AR2220此处是0/0,第一个0为主控板槽位,第二个0为DSP条槽位。对于AR2240或者AR3260,第一个0需要修改为主控板实际所在槽位,具体是哪个槽位可以通过display device命令查看。
- AR6120-VW、AR6280、AR6300可以使用display voice dsp state命令查看DSP条状态。
- 若已有语音license文件,用户通过FTP访问设备 ,将license文件加入到设备中。
- 用户通过FTP访问设备。从终端通过FTP访问设备,可以选择使用Windows命令行提示符或第三方软件。此处以Windows命令行提示符为例进行配置。
- 执行Windows命令ftp ip-address,通过FTP方式访问设备。
此处输入的IP地址为设备上配置的IP地址,且与用户终端IP地址路由可达。
- 根据提示输入用户名和口令,按Enter键,当出现FTP客户端视图的命令行提示符,如ftp>,此时用户进入了FTP服务器的工作目录。(以下显示信息仅为示意)
C:\Documents and Settings\Administrator> ftp 192.168.150.208 Connected to 192.168.150.208. 220 FTP service ready. User(192.168.150.208:(none)):huawei 331 Password required for huawei. Password: 230 User logged in. ftp>
- 执行Windows命令ftp ip-address,通过FTP方式访问设备。
- 通过FTP命令进行文件操作 。
用户访问FTP服务器后,可以参照表17-2通过FTP命令进行文件操作,包括目录操作、文件操作、配置文件传输方式、查看FTP命令在线帮助等。
用户的操作权限受限于服务器上对该用户的权限设置。
以下各操作没有严格顺序,可根据需求选择一种或多种操作项目。
表17-2 通过FTP命令进行文件操作操作项目
命令
说明
改变服务器上的工作路径
cd remote-directory
-
改变服务器的工作路径到上一级目录
cdup
-
显示服务器工作路径
pwd
-
在服务器上创建目录
mkdir remote-directory
创建的目录可以为字母和数字等的组合,但不可以为<、>、?、\、:等特殊字符。
在服务器上删除目录
mdir remote-directory
-
显示服务器上指定目录或文件的信息
dir/ls [ remote-filename [ local-filename ] ]
- ls命令只能显示出目录/文件的名称,而dir命令可以查看目录/文件的详细信息,如大小,创建日期等。
- 如果指定远程文件时没有指定路径名称,那么系统将在用户的授权目录下搜索指定的文件。
删除服务器上指定文件
delete remote-filename
-
上传文件
put local-filename[ remote-filename ]
-
下载文件
get remote-filename[ local-filename]
-
- 用户通过FTP访问设备。
- 输入active命令激活语音文件。
<Huawei>license active ***.dat
- 如果还没有购买语音license文件,请联系华为技术有限公司购买相应语音license。
通过如上步骤的排查,可以自动过滤解决大部分的DSP无法正常工作问题。
设备不上电
故障现象
设备的系统指示灯SYS和电源指示灯都不亮。
可能原因
未打开设备电源开关。
设备电源线缆没有插牢。
- 设备电源模块故障。
- 电源模块可插拔的设备:可插拔电源模块有故障。
- 电源模块外接的设备:外接电源适配器有故障。
- 电源模块内置的设备:设备本身有故障。
故障处理步骤
确认设备电源开关是否打开。
确认设备电源线缆是否插牢。
确认设备电源模块是否故障。
- 确认可插拔电源模块是否有故障:通过更换其它可以正常供电的可插拔电源模块,如果设备可以正常上电,可以确认是设备的可插拔电源模块有故障。请通过收集信息并联系技术支持,更换新的电源模块。
- 确认外接电源适配器是否有故障:通过更换其它可以正常供电的外接电源适配器,如果设备可以正常上电,可以确认是设备的外接适配器有故障。请通过收集信息并联系技术支持,更换新的电源适配器。
确认完以上3个步骤后,设备仍然不能正常上电,可以确认是设备本身有故障,请通过收集信息并联系技术支持,更换新的设备。
电源指示灯红色常亮
故障现象
电源指示灯红色常亮。
可能原因
设备上的电源模块没有插牢。
设备上的可插拔电源模块有故障。
设备的外接电源模块有故障。
故障处理步骤
将设备上的电源模块插紧。
更换设备上的可插拔电源模块。
更换设备的外接电源模块。
风扇模块噪音很大,STATUS指示灯为红色快闪状态
故障现象
风扇全速转动,噪音很大,STATUS指示灯为红色快闪状态。
可能原因
风扇模块没有完全插入风扇槽位。
风扇叶被异物卡住导致堵转。
风扇软件版本不是最新版本。
风扇模块本身故障。
故障处理步骤
重新插拔风扇模块,确保风扇模块可靠插入设备背板,拧紧风扇模块面板上的松不脱螺钉。
- 拔出风扇模块,清除堵住风扇叶的异物,重新将风扇模块插入机框。
风扇模块一般含有多个风扇叶,多个风扇叶中的任何一个风扇叶出现异常,风扇模块都会全速转动。
- 确认风扇对应的设备软件版本是否低于V200R003C01SPC300版本。
- 风扇全速转动时,执行display fan命令查询风扇模块状态,异常时打印信息如下。
<Huawei> display fan
FanId FanNum Present Register Speed Mode
16 [1-3] YES YES NA MANUAL
对比风扇模块正常时打印信息。<Huawei> display fan
FanId FanNum Present Register Speed Mode
16 [1-3] YES YES 49% MANUAL
1 2670
2 2640
3 2640
如果风扇噪音很大,但是执行display fan命令后显示风扇转速为100%,此时风扇为正常工作状态,全速转动的原因可能是因为设备周围环境温度过高。
- 当执行display fan命令显示风扇状态异常时,即speed项显示为NA,需要重新插拔风扇模块,然后用display version查询设备软件版本。
<Huawei> display version
Huawei Versatile Routing Platform Software VRP (R) software, Version 5.120 (AR3200 V200R003C01SPC300) Copyright (C) 2011-2013 HUAWEI TECH CO., LTD Huawei AR3260 Router uptime is 1 week, 5 days, 2 hours, 40 minutes BKP 0 version information: 1. PCB Version : AR01BAK3A VER.B 2. If Supporting PoE : No 3. Board Type : AR3260 4. MPU Slot Quantity : 2 5. LPU Slot Quantity : 10
如果设备软件版本低于V200R003C01SPC300版本,则需要升级风扇软件版本。
- 请通过收集信息并联系技术支持,获取对应的软件版本。
- 参照故障案例:使用FTP/TFTP传输文件介绍的方法,将软件版本加入到设备存储介质中。
- 在诊断视图下,执行upgrade fan-software startup命令,升级风扇软件版本。
<Huawei> system-view
Enter system view, return user view with Ctrl+Z
[Huawei] diagnose
Now you enter a diagnostic command view for developer's testing,some commands may affect operation by wrong use,please carefully use it with HUAWEI engineer's direction
[Huawei-diagnose] upgrade fan-software startup
Info: Now Loading the upgrade file to fan-board, please wait a moment
Info: Upgrade the fan-board successfully.The new version is 108, while the old version is 103
风扇软件版本更新时间较长,大约需要5分钟。
- 如果风扇软件版本升级过程中,风扇模块被插拔或者升级失败,则会打印如下信息。
[Huawei-diagnose] upgrade fan-software startup
Info: Now Loading the upgrade file to fan-board, please wait a moment
Load app get response fail! Index = 0xaa
Load Tx fail!
Error: Load the upgrade file to fan-board fail
在这种情况下,需要重新插拔风扇模块,然后返回步骤e,重新升级风扇软件版本。
风扇软件版本升级成功后会自动生效,不需要设备重启。
- 风扇全速转动时,执行display fan命令查询风扇模块状态,异常时打印信息如下。
使用相同型号正常工作的风扇模块替换插入该风扇槽位,如果该故障消失,说明风扇模块本身有故障,请更换新的风扇模块。
在更换风扇模块前,请先给设备断电后再进行更换操作。
设备无法启动,console接口打印异常
故障现象
设备无法启动,console接口打印异常。
可能原因
设备无法启动,设备不上电或者电源故障。
console接口参数配置错误。
console线缆故障。
设备启动路径配置错误。
启动文件所在存储体(SD卡、U盘)被移除或接触不好。
内存条松动。
故障处理步骤
查看设备面板指示灯,如果PWR指示灯是绿色常亮,则排除电源故障。如果PWR指示灯常灭,可以确定为设备不上电,具体解决办法请参见设备不上电。
- 首先查看console线缆是否正确插在设备CON口上,并且参数如下。
- 波特率:9600
- 数据位:8
- 停止位:1
- 奇偶校验位:无
- 流控:无
- 确认console线缆故障,可以考虑更换一根确定没有问题的console线缆。如果故障现象消除,可以确认为console线缆故障。
- 启动路径配置错误,按照下述方法重新配置启动路径。
- 重新启动设备,当设备启动到“Press Ctrl+B to break auto startup”阶段,快速同时按键盘上Ctrl+B两个按键。
BIOS Creation Date : Dec 31 2011, 17:33:44
DDR DRAM init : OK
Start Memory Test ? ('t' or 'T' is test):skip
Uncompressing : Done
USB2 Host Stack Initialized
USB Hub Driver Initialized
USBD Wind River Systems, Inc. 562 Initialized
Octeon Host Controller Initialize......Done
Press Ctrl+B to break auto startup ... 9
Ctrl+B阶段很短,只有几秒钟时间,请尽快按住相应的键盘,如果超时错过需要重新启动设备后再次等待输入。
- 输入Ctrl+B后,系统提示需要输入密码,请输入登录密码。
Press Ctrl+B to break auto startup ... 9
Enter Password:******
如果遗忘密码,请参考故障处理:密码遗忘重新获取密码。
- 输入密码后,出现如下的菜单,输入数字“5”。
Main Menu
1. Default Startup
2. Serial Menu
3. Network Menu
4. Startup Select
5. File Manager
6. Reboot
Enter your choice(1-6): 5
- 查看flash内的文件,输入数字“1”。
File Menu
1. Flash file system
0. Return
Enter your choice(1-2):1
- 查看flash内的文件列表,输入数字“1”。
Flash file system MENU
1. List file in flash
2. Delete file in flash
3. Rename file in flash
4. Format Flash file system
0. Return
Enter your choice(1-4): 1
- 系统会列出flash中所有的文件及文件名称,这时需要查找后缀为“.cc”的文件,记录相应的文件名称。
Enter your choice(1-4):1
Directory of flash:/* :
-rw- 68229504 Sep 30 2011 11:04:12 AR1220_V200R001C00SPC500.cc
-rw- 68229504 Sep 30 2011 11:04:12 AR1220-S_V200R002C00SPC600.cc
-rw- 1738816 Feb 26 2012 14:50:32 web.zip
-rw- 396 Feb 26 2012 14:50:34 rsa_host_key.efs
-rw- 540 Feb 26 2012 14:50:48 rsa_server_key.efs
-rw- 277 Feb 26 2012 14:51:38 mon_file.txt
5 files found!
文件名区分大小写。
- 记录好文件名,然后选择“0”返回到上一级菜单。
Flash file system MENU
1. List file in flash
2. Delete file in flash
3. Rename file in flash
4. Format Flash file system
0. Return
Enter your choice(1-4): 0
- 选择“0”返回到主菜单。
File Menu
1. Flash file system
0. Return
Enter your choice(1-1): 0
- 进入到启动设置菜单,输入数字“4”。
Main Menu
1. Default Startup
2. Serial Menu
3. Network Menu
4. Startup Select
5. File Manager
6. Reboot
Enter your choice(1-6): 4
- 进入Flash中,输入数字“1”。
Select Boot Device
1. Flash
0. Return
Enter your choice(1-1): 1
- 在光标停留处,输入在第f步中记录的文件名称,输入完后按回车键,并且在后面输入字母“y”进行确认。
Save load state word...OK!
NOTE: Boot file must be .cc or .CC
Current boot file:
Press ENTER directly for no change.
Or, please input the new file name: flash:/AR1220_V200R001C00SPC500.cc
Or, please input the new file name: flash:/AR1220-S_V200R002C00SPC600.cc
Or, please input the new file name: flash:/SRG1320_V200R003C00SPC800.cc
Save the bootfile name: flash:/ARV200R007C00.cc ? Yes or No(Y/N) y
Save load state word...OK!
在输入文件名称时在光标处不要有空格键,如果输入错误请不要使用backspace退格键,直接按回车键确认,然后重新回到“i”步重新设置。
- 输入完毕,系统会自动返回到主菜单,再输入数字“1”即可。
Save load state word...OK!
Main Menu
1. Default Startup
2. Serial Menu
3. Network Menu
4. Startup Select
5. File Manager
6. Reboot
Enter your choice(1-6): 1
- 系统会重新启动。
Enter your choice(1-6):1
Enter auto startup
Now boot from flash:/ ARV200R007C00.cc, please wait....
- 等系统重新启动完成后,输入下面的命令将故障前配置文件(假设为iascfg.zip)恢复,然后按回车键即可。
<Huawei>startup saved-configuration iascfg.zip
This operation will take several minutes, please wait..........
Info: Succeeded in setting the file for booting system
- 重新启动设备,当设备启动到“Press Ctrl+B to break auto startup”阶段,快速同时按键盘上Ctrl+B两个按键。
- 启动文件可以存放在设备内部Flash、SD卡和U盘中,如果文件存在SD卡或U盘中,且SD卡或U盘被拔出,则设备不能正常启动,需要将存储体重新插入才能正常启动。有时也可能是接触不好导致的设备不能正常启动,建议重新拔插SD卡或U盘后重启设备。
- 对于AR2240、AR3260、AR3670和AR2240-S和AR3260-S、AR3260E-S、,把主控业务路由单元板拔出机框,将主控业务路由单元板里面的内存条拔出后重新插入,并锁紧内存条门栓。
单板无法上电
故障现象
单板无法上电。
可能原因
单板没有插紧。
软件版本不支持。
故障处理步骤
查看单板是否插牢。
使用display version命令查看软件版本信息。
<Huawei> display version
Huawei Versatile Routing Platform Software
VRP (R) software, Version 5.120(AR3200 V200R003C00)
Copyright (C) 2011-2012 HUAWEI TECH CO., LTD
Huawei AR3260 Router uptime is 1 week, 0 day, 7 hours, 47 minutes
BKP 0 version information :
1. PCB Version : AR01BAK3A VER.B
2. If Supporting PoE : No
3. Board Type : AR3260
4. MPU Slot Quantity : 2
5. LPU Slot Quantity : 10
MPU 15(Master) : uptime is 1 week, 0 day, 7 hours, 47 minutes
SDRAM Memory Size : 2048 M bytes
Flash Memory Size : 16 M bytes
NVRAM Memory Size : 512 K bytes
SD Card1 Memory Size : 1882 M bytes
MPU version information :
1. PCB Version : AR01SRU3A VER.B
2. MAB Version : 0
3. Board Type : SRU80
4. CPLD0 Version : 104
5. CPLD1 Version : 104
6. FPGA Version : 123
7. BootROM Version : 617
- 请通过收集信息并联系技术支持,确认单板是否支持该软件版本。
系统软件升级后单板不能注册
故障现象
单板在系统软件升级前工作正常,在系统软件升级后指示灯红色常亮,不能注册。
- 单板正常注册时,打印信息如下,其中Register状态为Registered,表示注册成功。
<Huawei> display device
AR3260's Device status:
Slot ub Type Online Power Register Alarm Primary
5 8FE1GE Present PowerOn Registered Normal NA
- 单板注册失败时,打印信息如下,其中Register状态为Unregistered,表示注册失败。
<Huawei> display device
AR3260's Device status:
Slot Sub Type Online Power Register Alarm Primary
5 8FE1GE Present PowerOn Unregistered NA NA
可能原因
升级前后单板是否插拔过,单板未插紧时会导致单板注册失败。
设备软件升级时,先升级系统软件,再升级单板软件。如果在系统软件升级后、单板软件升级过程中出现设备掉电,会导致单板软件更新错误。
故障处理步骤
- 重新插拔单板并检查机箱内背板连接器是否有倒针,确保单板可靠插入背板。
机箱内通常光线较暗,检查背板连接器时需借助手电筒增强光照。
- 参照收集信息并联系技术支持,恢复单板软件。
单板软件升级需要时间较长,约为8分钟,升级过程中切勿掉电。
单板在运行过程中异常复位
故障现象
单板在运行过程中异常复位。
可能原因
- 系统电源未可靠连接
- 单板与设备背板之间未插紧
- 电网电压不稳定
- 雷雨天气
故障处理步骤
关掉设备电源开关,插紧电源线缆和电源模块,重新上电。
重新插拔单板,确保单板与设备背板之间可靠连接。
观察白炽灯是否忽明忽暗来确认电压是否稳定,如果电压不稳,建议使用稳压器或者不间断电源供电。
将设备上的接地点与室内等电位连接端子连接在一起,可以有效降低单板因雷雨天气异常复位风险。
E1接口物理层不能UP
故障现象
E1接口物理层不UP,查看接口状态如下。
<Huawei> display interface Serial 3/0/0
Serial3/0/0 current state : DOWN
Line protocol current state : DOWN
Description:HUAWEI, AR Series, Serial3/0/0 Interface
Route Port,The Maximum Transmit Unit is 1500, Hold timer is 10(sec)
Internet protocol processing : disabled
Link layer protocol is PPP
LCP initial
Timeslot(s) Used: 1-31, baudrate is 1984000 bps
可能原因
通讯线缆线序错误。
故障处理步骤
- 如果设备通信使用的是同轴线缆,将收发两根线缆调换下。
- 如果设备通信使用的平衡线缆,检查线缆的线序是否正确。
- 单板DB9接头线序:1、2接收,6、7发送。
- 平衡线缆RJ45线序:1、2发送,4、5接收。
E1接口通讯异常
故障现象
E1接口链路不通,接口反复UP/DOWN,接口统计数据中有很多CRC错误。
在系统视图下,用display interface Serial命令查看E1接口状态。
[Huawei] display interface Serial 1/0/0
Serial1/0/0 current state : UP
Line protocol current state : UP
Last line protocol up time : 2012-02-13 10:16:53
Description:to Shengting-R1
Route Port,The Maximum Transmit Unit is 1500, Hold timer is 10(sec)
Internet Address is 10.21.254.126/30
Link layer protocol is PPP
LCP opened, IPCP opened
Timeslot(s) Used: 0-31, baudrate is 2048000 bps
Last physical up time : 2012-02-13 10:16:49
Last physical down time : 2012-02-13 10:15:29
Current system time: 2012-02-13 16:17:49
Last 300 seconds input rate 59 bytes/sec 472 bits/sec 1 packets/sec
Last 300 seconds output rate 178 bytes/sec 1424 bits/sec 1 packets/sec
Input: 22225 packets, 1484955 bytes
Length Error: 0, Giants: 0
CRC: 11, Alignments: 0
Aborts: 0, No Buffers: 0
Output: 42061 packets, 4043517 bytes
Total Error: 0, Too Long Error: 0
Input bandwidth utilization : 0.02%
Output bandwidth utilization : 0.13%
可能原因
E1单板未接地。
E1线路经过地点存在电磁干扰源,如电动机、变压器和发电机。
E1线路出户走线,接口由于雷雨天气导致损坏。
E1接口阻抗与线路阻抗不匹配。
故障处理步骤
- 设备包装箱内有专用接地线,取出接地线连接设备接地点和室内等电位连接点,确保设备地和对接设备地平面一致。
- 将E1线路同电磁干扰源分离开,尽量远离。
- 参照收集信息并联系技术支持,维修单板。
- E1接口有2种阻抗,平衡模式(120-ohm)匹配120欧姆平衡线缆,非平衡模式(75-ohm)匹配75欧姆非平衡线缆,确保E1接口设置的阻抗与所用的线缆一致。
- E1接口阻抗配置命令:
[Huawei-Serial2/0/0] fe1 line-termination ?
75-ohm 75 ohm termination
120-ohm 120 ohm termination
- E1接口阻抗查询命令:
[Huawei-Serial2/0/0] display fe1 Serial 2/0/0
Serial2/0/0
Basic Configuration:
Work Mode is E1 Fractional Framed, Cable type is 120 Ohm balanced
Frame-format is NO-CRC4, Line Code is Hdb3
Source Clock is Slave, Data-coding is Normal
Idle code is 7E, Itf type is 7E, Itf number is 4
Loopback is Not Set
Idle code is 7E, Itf type is 7E, Itf number is 4
Alarm State:
Receiver alarm state is Loss-of-Signal
Transmitter is sending remote alarm
Pulse density violation detected
Historical Statistics:
Data in current interval (0 seconds elapsed):
0 Line Code Violations, 0 Path Code Violations
0 Slip Secs, 0 Fr Loss Secs, 0 Line Err Secs, 0 Degraded Mins
0 Errored Secs, 0 Bursty Err Secs, 0 Severely Err Secs, 0 Unavail Secs
Total Data (last 24 hours):
0 Line Code Violations, 0 Path Code Violations
0 Slip Secs, 0 Fr Loss Secs, 0 Line Err Secs, 0 Degraded Mins
0 Errored Secs, 0 Bursty Err Secs, 0 Severely Err Secs, 0 Unavail Secs
- E1接口阻抗配置命令:
光接口对接不能UP
故障现象
光纤连接后,光接口LINK指示灯不亮。
可能原因
- 光纤有问题
- 光模块存在问题
- 线路上光衰选择不合适
- 对于电口和光口复用的接口,可能是没有将接口配置为光口。
故障处理步骤
- 更换能正常工作的光纤和光模块来验证光纤或光模块是否有问题。
- 确认光模块属性。
- 确认端口使用的光模块是否为华为技术有限公司认证的光模块。
- 确认光模块速率与光接口速率是否一致。
- 确认光模块的工作波长与对端使用的光模块工作波长是否一致。
- 确认光模块的使用距离与标称距离是否相当。
- 光模块的使用距离有10km、15km、20km、40km和80km,距离越长光模块发射功率越大。如果误将长距离光模块使用在短距离场景,则由于光功率过大导致光接口不能LINK,甚至烧毁光模块接收器。短距离场景下使用长距离光模块时,光模块与光纤之间一定要加入适当光衰,减少光模块发射功率。
- 光模块有多种速率,如155Mbit/s、622Mbit/s、1.25Gbit/s等,光模块建议选用和光端口标称速率完全一致,从而保证光通信的高效传输。
- 对于光电复用端口,可以使用display this命令来查看当前端口是否设置为光口。
<Huawei> system-view
Enter system view, return user view with Ctrl+Z
[Huawei] interface GigabitEthernet 0/0/0
[Huawei-GigabitEthernet0/0/0] display this
[V200R002C00SPC100]
#
interface GigabitEthernet0/0/0
combo-port fiber
#
Return
如果没有配置为光口,使用combo-port fiber命令把光电复用端口设置为光口。
<Huawei> system-view
Enter system view, return user view with Ctrl+Z
[Huawei] interface GigabitEthernet 0/0/0
[Huawei-GigabitEthernet0/0/0] combo-port fiber
- 使用display transceiver verbose命令查看光模块信息,检查是否有告警,根据告警信息做相应处理,比如提示接收信号过高时,则适当增加接收回路的光衰。
<Huawei> display transceiver verbose
GigabitEthernet0/0/0 information:
Electronic label information:
Description: 2100Mb/sec-1550nm-LC-104km(0.009mm)
Type: FTLF1619P1BCL
VendorSN: PL80MZP
Manufacturing Date: 2011-08-15
Manufacturer: FINISAR CORP
Alarm information: RX power High
Realtime information:
Temperature(¡æ): 24
Voltage(V): 3.31
Bias Current(mA): 18.09
Bias High Threshold(mA): 95.00
Bias Low Threshold(mA): 4.00
Current Rx Power(dBM): -43.45
Default Rx Power High Threshold(dBM): -8.23
Default Rx Power Low Threshold(dBM): -27.95
Current Tx Power(dBM): 2.12
Default Tx Power High Threshold(dBM): 7.00
Default Tx Power Low Threshold(dBM): -2.00
User Set Rx Power High Threshold(dBM): -8.23
User Set Rx Power Low Threshold(dBM): -27.95
User Set Tx Power High Threshold(dBM): 7.00
User Set Tx Power Low Threshold(dBM): -2.00
Default Temperature high Threshold(¡æ): 103
Default Temperature low Threshold(¡æ): -8
光衰选择可参照:单模光纤在1310nm和1550nm波长区的衰减常数分别是0.4dB/km和0.25dB/km。
- 以上故障均排除后,如问题仍不能解决,参照收集信息并联系技术支持。
SD卡/USB存储器无法写入
故障现象
无法对SD卡/USB存储器进行读写操作。
可能原因
SD卡/USB存储器没有插牢。
SD卡/USB存储器损坏。
处理步骤
重新插拔存储器。
更换SD卡/USB存储器。
SD卡/USB存储器需要使用通过华为认证的产品。
如果更换SD卡/USB存储器后,SD卡/USB存储器仍然无法写入,请通过收集信息并联系技术支持。
Memory故障
内存占用率是指程序已经使用的内存大小占总内存大小的比例。内存占用率是衡量设备性能的重要指标之一。
故障现象
内存占用率直观表现为display memory-usage命令查询结果中的内存情况。缺省情况下,内存占用率超过95%会产生告警ENTITYTRAP_1.3.6.1.4.1.2011.5.25.219.2.15.1 hwMemUtilizationRising。内存占用率持续增长,最终会导致系统自动复位,造成业务中断。
可能原因
内存占用率持续增长通常是由于内存泄露导致的。
内存泄露是指应用程序长时间占用内存不释放,致使占用的内存空间不断累积增长,最终导致系统内存耗尽。
处理步骤
根据以下步骤,收集设备总的内存占用率、2号分区大小块、指定块、各个PID和指定PID的内存使用情况,并将收集到的信息提供给华为技术有限公司。
查看总的内存占用率。
<Huawei> display memory-usage
定期(建议以1天为周期,收集3次)查看2分区大小块的内存使用情况。
<Huawei> system-view [Huawei] diagnose [Huawei-diagnose] display inspect mem-debug-info 13 2 0 0
命令display inspect mem-debug-info record-number mid-hex hex-string hex-value中,参数record-number的含义可通过如下方式获取:[Huawei-diagnose] display inspect mem-debug-info ? INTEGER<0-26> 0 help; 1 utilization; 2 contents; 3 memory by address; 4 memory by time; 5 memory by PID; 6 memory by SID; 7 memory by SID & PID 8 block size; 9 memory by used size; 11 shortage; 12 tracing; 13 show partition; 14 show information; 15 show Size; 16 pid by size; 17 show PID; 18 show all; 19 show PID & SID 20 alloc free times; 21 block PID by SID; 22 memory piece; 23 alloc failed; 24 PID peak value; 25 partition; 26 partition used by PIDSID
其中,13:分区统计信息,16:PID大小,26:按PID&SID分区。查看指定大小块(步骤2中UsedSize字段的值持续增长的大小块)的内存使用情况。
如果步骤2中,Size为84的大小块的UsedSize字段持续增长,查看该大小块的内存使用情况:
<Huawei> system-view [Huawei] diagnose [Huawei-diagnose] display inspect mem-debug-info 16 2 54 0
倒数第二个参数为16进制,即0x54=84。
定期(建议以1天为周期,收集3次)查看各PID的内存使用情况。
<Huawei> system-view [Huawei] diagnose [Huawei-diagnose] display inspect mem-debug-info 26 2 0xffffffff 0
查看指定PID(步骤4中AllocSize字段的值持续增长的PID)的内存使用情况。
如果步骤4中,PID为0xff32的AllocSize字段持续增长,查看该PID的内存使用情况:
<Huawei> system-view [Huawei] diagnose [Huawei-diagnose] display inspect mem-debug-info 26 2 0xff32 0