智能运维
智能运维概述
大数据时代,传统的基于指定规则的运维模式已经支撑不了用户对网络的运维需求,自动化运维能力的不足,日益凸显。主要体现在如下方面:
- 传统运维基于SNMP协议,分钟级采集数据。一旦发生问题,故障发生时刻数据无法实时获取;
- 传统运维仅监控设备指标,有可能指标正常,但用户体验不好,缺少用户和网络的关联分析;
- 传统运维往往等到用户投诉了,才知道网络发生了问题,无法有效主动识别、分析问题;
华为iMaster NCE-CampusInsight网络智能分析平台,颠覆传统聚焦资源状态的监控方式,将人工智能应用于运维领域,通过Telemetry技术采集网络设备的性能指标和日志数据,通过大数据、人工智能算法及更多高级分析技术,通过场景化的持续学习和专家经验,将运维人员从复杂的告警和噪声解放出来,使得用户网络体验可视化、运维变得自动化和智能化。
智能运维方案架构
iMaster NCE-CampusInsight使用华为公司的大数据分析平台,采用Telemetry技术方案接收设备上报的数据,通过运用智能算法对网络数据进行分析、呈现。
图1 iMaster NCE-CampusInsight逻辑架构
整体方案架构的底层是园区网络设备层,提供了用户、射频、AP、交换机、用户日志等多维度数据采集能力,并通过Telemetry技术上送到分析器平台;中间层是iMaster NCE-CampusInsight数据分析层,主要提供大数据存储(实现预处理实时流量、分布式处理离线流量以及数据存储服务等)和数据分析服务(实现模式识别、智能引擎等);最上层为服务提供层,即为客户提供数据分析的最终服务,主要包括网络可视化、园区业务分析、智能无线网络以及用户应用体验等几个方面。
分类 |
功能 |
功能说明 |
---|---|---|
网络可视化 |
网络健康度 |
用户接入体验:从关联、认证、DHCP三个阶段分析用户接入网络的接入成功率和耗时达标率,度量网络接入性能; 用户漫游体验:基于漫游成功率和耗时达标率,度量无线用户漫游质量,识别无线漫游问题; 用户吞吐体验:涵盖覆盖、容量健康度、吞吐达标率,分析信号覆盖是否达标,网络是否过载,判断吞吐量是否下滑等; 设备在服率:统计设备在服率,评估网络整体可用性,识别设备退服问题; |
一体化拓扑 |
一体化拓扑基于无线业务接入成功率展示各站点的质量分析与横向对比,智能分析故障模式,识别故障边界,初步给出故障根因。 |
|
园区业务分析 |
问题分析 |
分析器基于性能指标、日志等数据进行分析,识别和统计连接、空口性能、漫游、设备四大类网络问题,针对每一个问题类的指标展示受影响的AP和用户信息。 |
接入分析 |
用户接入模块从用户接入故障事件趋势等方面全局审视网络接入质量。 用户接入故障事件统计:关联失败次数、认证失败次数、DHCP失败次数、总接入次数。 用户接入故障事件趋势:支持时间区间框选,趋势图下方展示连接失败设备的分布和连接失败终端的分布,以面积图的形式呈现问题分布的设备和终端 |
|
性能分析 |
提供基于信号强度、协商速率、丢包率评价用户体验,并展现一段时间内,各时间点体验好和差的用户数和趋势;提供单指标的用户分布趋势分析。基于AP和用户维度的差体验分析,帮助管理员识别差体最大的AP和用户 |
|
协议回放 |
支持基于用户接入阶段协议级别过程呈现,包括关联、认证、DHCP,通过细化各个协议交互阶段结果与耗时,提供用户接入过程个障的精细化分析,支持呈现用户接入失败的大概率根因与修复建议。 当前协议回放支持如下用户认证场景:802.1x认证、Portal 2.0协议的Portal认证、Https协议的Portal认证、HACA认证、MAC认证; |
|
智能无线网络 |
智能无线射频调优 |
通过采集设备上报的KPI和射频参数信息,运用智能算法分析,计算下一个调优周期的负载预测信息,同时通过大数据分析算法准确识别网络拓扑以及边缘AP列表信息,并响应设备的请求将信息推送到设备上。无线设备根据分析器下发的信息以及实时采集的网络信息进行智能无线射频调优。调优完成后,设备通过周期上报当前网络的KPI信息以及调优日志信息到分析器,分析器对无线调优前后的无线网络参数进行对比呈现 |
WLAN拓扑 |
网规导入:导入Wlan Planner工具规划的网规文件,在iMaster NCE-CampusInsight中呈现网规的站点、预部署AP、障碍物、背景图、比例尺等数据; 网规对比:针对网规导入的预部署AP在关联真实AP后提供功率、信道、频宽、终端数、协商速率、信号强度等六个指标的规划数据和运行数据对比,并展示对比结果; WIFI热图呈现:支持基于AP点位查看射频热图 |
|
用户应用体验 |
应用分析 |
可以基于音频/视频业务会话进行监控和分析,展示SIP会话统计信息、业务流量趋势以及会话详情列表,帮助用户快速了解音频/视频业务的质量状态 |
智能运维方案部署设计
智能运维方案集成了iMaster NCE-CampusInsight、iMaster NCE-Campus和设备等组件,当前iMaster NCE-CampusInsight支持对华为云交换机、云AP设备的管理和智能分析。
- 网络带宽设计
由于设备需定时上报数据到iMaster NCE-CampusInsight,园区网络需要预留带宽保障数据上报,平均每设备消耗3Kbps带宽。
- 安装位置设计
iMaster NCE-CampusInsight和iMaster NCE-Campus可以部署在不同位置,只要两者网络互通就可以协同工作,但是为了避免中间网络不稳定性,建议两者部署在同一位置,如同一个数据中心。
- 服务器部署与选型设计
iMaster NCE-CampusInsight服务器部署时,支持集群版部署和单机版部署两种方式,请按照网络规模选择部署方式和节点类型,并且配置对应的软硬件资源。详细的软硬件要求请参考对应版本的iMaster NCE-CampusInsight产品手册。
智能运维设计注意事项
- 网络部署设计注意事项
- 网络部署时,需要保证AP的IP地址和分析器地址路由可达,保证AP能将KPI性能数据和日志信息上送到iMaster NCE-CampusInsight。
- 网络部署时,需要保证设备时钟和分析器的时钟保持同步,建议在网络中部署NTP Server来同步网络的系统时钟;
- 一体化拓扑功能设计注意事项:
- 基于一体化拓扑做群障业务分析时,仅支持普通的树形组网;
- 协议回放功能设计注意事项:
- DHCP相关接入类问题的识别和协议回放,需要WAC设备作为DHCP服务器或在WAC设备上开启DHCP Snooping功能;
- 音视频质量分析功能设计注意事项:
- 音视频质量分析功能需要设备将相关日志信息上送到分析器,交换机和WLAN设备配置的日志上送周期要尽量保持一致,上送周期偏差最大不可超过20s。
- 智能无线射频调优功能设计注意事项:
- 同一个区域内的AP,不支持同时部署智能无线射频调优功能和传统无线射频调优功能;