一种面向家宽业务拥塞故障的自动均衡解决方案

/ 2

一种面向家宽业务拥塞故障的自动均衡解决方案

张守懿,徐雯

中国移动通信集团湖北有限公司,湖北武汉,430020

要:针对常见的家庭宽带故障,本文提出了一种基于自动驾驶技术的家宽业务拥塞故障自动均衡解决方案,该方案主要基于自动驾驶网络技术,利用现有城域网BRAS设备已接入的数据网管平台采集分析功能,定制自动对BRAS下接OLT用户均衡情况定时采集任务,定制自动分析家宽用户数均衡比对分析任务,自动生成BRAS针对接入OLT子接口的家宽用户自动踢下线配置脚本,确保BRAS下接OLT用户数恢复正常状态,进而解决城域网链路拥塞故障。

关键词:家庭宽带业务;城域网;自动驾驶网络;业务拥塞;自动均衡

1  概述

作为一家全业务运营商,中国移动的CMNET城域网为确保BRAS(Broadband Remote Access Server,宽带远程接入服务器)下接OLT(Optical Line Terminal,光线路终端)的家宽用户结构冗余,采用温备的方案实现PPPOE家宽用户接入,即接入家宽用户的OLT采用V字型双上联成对两台BRAS设备,并且两条链路分别负载承载所有用户流量。当其中一条上联链路因光缆中断、传输故障、割接倒换等原因发生中断后,承载的家宽用户业务中断后,会自动切换到另外一条链路,并通过PPPOE拨号接入另外一台BRAS上,以此保证家宽业务安全性。

然而,由于此业务保障结构,且各省OLT上联链路中断情况较为频繁,因此城域网产生的70%超限链路主要原因为OLT上联链路故障后单边承载拥塞导致,其中因此部分城域网拥塞链路会出现90%超限,已严重影响家宽用户使用感知和满意度。如何压减因光缆、传输故障短时中断,导致城域网链路拥塞故障,是城域网系统运维人员需重点解决的问题。为了解决这一问题,维护人员基于自动驾驶技术,利用IT手段,通过自动采集比对分析BRAS下接OLT用户数据,同时利用现有CMNET配置自动下发手段,完成部署了城域网家宽业务拥塞故障全自动均衡调优解决方案。

基于自动驾驶技术的家宽业务拥塞故障自动均衡解决方案,主要基于自动驾驶网络技术,利用现有城域网BRAS设备已接入的数据网管平台采集分析功能,定制自动对BRAS下接OLT用户均衡情况定时采集任务,定制自动分析家宽用户数均衡比对分析任务,根据分析任务结果,当成BRAS下接OLT出现接入用户均衡占比超设定阀值6:4时,自动生成BRAS针对接入OLT子接口的家宽用户自动踢下线配置脚本,并定制凌晨5点自动触发符合条件的BRAS自动下发下线配置的全自动化流程,确保BRAS下接OLT用户数恢复到链路、传输故障导致用户接入不均衡前的正常状态,进而解决因光缆、传输中断导致的城域网链路拥塞故障。

基于自动驾驶技术的家宽业务拥塞故障自动均衡解决方案

2.1  方案描述

CMNET城域网为确保BRAS下接OLT的家宽用户结构冗余,采用温备的方案实现PPPOE家宽用户接入,即接入家宽用户的OLT采用V字型双上联成对两台BRAS设备,并且两条链路分别负载承载所有用户流量,当其中一条上联链路因光缆中断、传输故障、割接倒换等原因发生中断后,承载的家宽用户业务中断后,会自动切换到另外一条链路,并通过PPPOE拨号接入另外一台BRAS上,以此保证家宽业务安全性,但是由于非故障情况下,我省40%以上OLT上联链路带宽利用超35%以上,并且全省每日均会出现因光缆、传输等各种原因,导致OLT上联链路中断的后BRAS下联家宽业务单边承载后会出现70%拥塞超限,部分流量较大的链路会出现90%严重拥塞超限情况,进而影响家宽用户使用感知和满意度。

城域网处置因光缆、传输故障导致的城域网拥塞及BRAS高负荷链路占比问题时,必须通过维护人员登录BRAS设备针对出现故障导致拥塞的OLT进行踢用户下线操作,确保此OLT所有用户重新拨号上线后实现用户数均衡。效率较低,且因全省OLT数量较多,工作量较大。

图1:面向家宽业务拥塞故障的自动均衡解决方案示意图

基于自动驾驶技术的家宽业务拥塞故障自动均衡解决方案,首先参考自动驾驶网络工作要求及技术思路,利用现网已有的IT化手段,包括省内数据网管系统已有功能,包括数据网管采集城域网性能数据功能,配置采集功能、城域网作业计划日常巡检功能,配置分析比对功能,CMNET配置自动化下发功能,按照自动驾驶技术技术要求,对上述功能平台进行了重新整合和关联,整个方案的设计思路,条件设定、关联要求、任务定制要求,跨厂家BRAS配置自动化下发配置测试,均通过CMNET维护人员设计并测试完成。该成果在实施过程中方案实施过程中,除均衡部署外,另外一个难题是如何让用户在2台BAS间均衡分布。温备BAS成对部署,用户业务VLAN同时透传给两台BAS设备,用户PPPOE拨号过程中,那台BAS先响应,用户即接入该BAS。部署过程中,发现两台BAS的响应时间略有差异,虽然以微秒计,但最后可能造成2台BAS上接入用户差异巨大,如BAS1接入25000用户,BAS2可能才2000用户。不同汇聚之间的差异很大。为解决该问题,维护人员通过自主研究分析,基于PPPOE过程中的PADO报文响应延迟技术实现,通过在城域网不同厂家BRAS部署基于MAC奇偶(或者基于时间轴轮巡)的pado-delay策略,最后达到用户均衡分布的目的,方案的优化规则完全由团队自主设计,根据不同的厂家BRAS场景,结合城域网家宽业务接入特点实现问题的最终解决。

2.2  方案的创新点与优势

本文提出的基于自动驾驶技术的家宽业务拥塞故障自动均衡解决方案,是基于自动驾驶网络技术思路,利用现有可用的IT化手段,通过整合数据网管采集城域网设备性能数据功能,CMNET配置自动化功能,通过设定判断条件、设定自动执行任务,全流程实现无人参与的故障分析,定位、配置的自动驾驶处置流程。整个自动化流程已达到人工智能处置现网故障场景的技术特点。

该方案的优势在于全流程在无人员干预的情况下,根据预设现网成熟的判断条件,自动判定BRAS下接OLT用户不均衡故障场景,并通过自动设定定时任务,实现在城域网链路拥塞故障发生前,自动恢复OLT用户上联成对BRAS的均衡状态,并且不会出现因错误配置导致业务影响的风险,并且提升城域网维护工作效率。

同时,方案最大亮点为自动驾驶技术在城域网维护工作中深入应用,极大提升了工作效率,压减了维护人员工作量。该方案未部署前,城域网处置因光缆、传输故障导致的城域网拥塞及BRAS高负荷链路占比问题时,必须通过维护人员登录BRAS设备针对出现故障导致拥塞的OLT进行踢用户下线操作,确保此OLT所有用户重新拨号上线后实现用户数均衡。效率较低,且因全省OLT数量较多,工作量较大,此方案部署后通过全流程自动化处置的方式,在无风险的情况下,处置了故障导致的城域网链路拥塞问题,极大压减了城域网一线维护人员的工作量,非常具有推广价值。

3  结束语

本文提出的家宽业务拥塞故障自动均衡解决方案,通过全流程自动化任务设定解决OLT上联链路故障后导致接入BRAS用户数不均衡,压单边承载链路拥塞问题,及时处置了因故障导致城域网拥塞的故障场景,压减了因此导致的用户投诉和满意度下降的问题。目前,该解决方案已面向全省的所有地市分公司进行了推广,效果显著,成绩喜人,家庭宽带方面的投诉大幅减少,用户的客户满意度和业务体验得到了大幅提升。

参考文献

[1]张龙; 罗博文. 基于家庭宽带用户业务感知的品质宽带精细化运营方案[J]. 电信工程技术与标准化. 2022(06).

[2]彭友斌. 宽带故障主动关怀方案设计与系统实现[J]. 网络安全和信息化. 2021(08).

[3]田上力; 郑翰. LTE多频多载波复杂组网下的业务均衡优化方法浅析[J]. 通信技术. 2020(02).

-----------

作者介绍:张守懿(1978-7),男,汉族,湖北武汉,江汉大学学士,通信高级工程师,从事互联网承载网维护管理工作;徐雯(1984-),女,汉族,湖北武汉人,中国地质大学(武汉)硕士研究生,助理工程师,从事通信行业CMNET专业相关工作。