文/黄海凤
随着5G、物联网、政企专线、超高清视频、智能家居等业务的发展,光纤网、IP网、家庭Wi-Fi等FBB网络正遭遇越来越复杂的运维。如果电信运营商的网络能够像自动驾驶汽车一样自动运行维护,对于运营商的业务发展将是一件极好的事情。
“自动驾驶网络的最终目标是实现自愈,而自愈的前提是能够准确预测网络故障,实时感知,快速诊断,快速恢复。”在12月11日华为共赢未来全球在线峰会上,华为NCE产品部总裁陆海欧强调了主动智能运维的重要性。
目前人工智能的AI技术正在赋能千万个行业。在电信领域,基于AI的智能网络分析被认为可以加速FBB网络的自动驾驶。那么,AI如何帮助运营商的运维转型呢?如何将AI技术和系统应用于自动驾驶网络,实现“分钟级故障感知-诊断-修复”?
智能时代,连接行业迎来五大变革。
业界普遍认为,未来十年是智能时代蓬勃发展的黄金十年。当人类步入万物互联、万物感知、万物智能的智能时代,人们的生活方式和工作方式将发生翻天覆地的变化。作为万物互联基础的网络也在发生变化。
对此,陆海欧表示,网联行业正在发生五个预期的变化。
第一,连接对象更加多样。网络除了传统的连接人与家庭的维度,还将连接大量的智能终端和行业代理。
变化二:网络将通过5G、Wi-Fi 6、光纤等接入技术提供“无处不在的千兆”连接服务能力。
变化三:多样化的连接场景。一方面,家庭网络正从服务信息和娱乐走向教育和办公;另一方面,企业网络从服务办公走向生产。
变化:应用程序需要更详细的连接。网络服务将从尽力而为向区分服务和确定性保证发展。
变化:网络运维管理将走向超自动化。
在上述五项变革中,第五项变革得到了各方的认可。根据Gartner发布的十大战略趋势报告,网络自动化将是不可逆转的必然趋势。
事实上,我们可以预测,AI技术将成为实现上述变革过程的重要催化剂。在陆海欧看来,运营商网络通过引入大数据和AI,将进一步提高系统自动化水平,大大降低运维的复杂度。
AI FBB网络带来的变化包括三个方面。陆海欧介绍,第一,AI让网络感知从模糊到精细,从非实时到实时,实现了网络的全景可视;二是通过数据分析和特征挖掘,AI使趋势可预测,根源可获知;第三,通过自主场景决策,AI使故障自愈,将网络运维从被动响应变为主动管理。
将AI全面引入网元、网络、云端,打造故障“0-1-3-5”运维方案。
AI是网络自动化的催化剂,已经得到大量运营商的认可。我们也看到全球领先的运营商,包括中国的三大运营商,都在致力于将AI引入网络管理和运营。
那么电信运营商如何更好的引入AI呢?对此,陆海欧介绍了华为的理解。华为认为,业界可以构建云、网、设备三层AI架构,系统地引入网元、网络、云的AI能力。
首先,在网元层面,华为通过轻量级的AI推理框架,提升网络体验数据的实时感知能力,结合场景特征,提供网元层面的短周期感知分析和预测诊断能力。
其次,在网络层,华为iMaster NCE基于网元库存数据、配置数据、网络性能和告警数据、网络运行日志等网络数据的采集、存储和分析,将物理网络数字化映射到数字孪生,从而创建张全景可视化网络高清地图。
在此基础上,通过iMaster NCE内置的网络级AI推理框架,将华为在通信领域30年积累的经验融入通用AI算法,开发出“资源预测、网络KPI检测、故障归纳、异常根源确认”等4种网络AI算法,实现FBB网络闭环自治。
再次,在云端,华为通过云智能服务平台提供数据、模型训练和更新服务,针对AI模型普遍面临的算法老化和泛化问题。通过云地协作模式,支持网络领域AI算法的开发、集成和更新迭代,让算法更智能、更精准。
从结尾开始可以少走弯路。运营商构建自驱动FBB网络是为了实现网络自愈,而要实现网络自愈,就必须能够准确预测网络故障,还必须能够实时感知、诊断并快速恢复。这需要行业引入创新工具。
为此,华为推出iMaster NCE,融合云NAIE和跨域智能运维AUTIN面向运维场景,共同实现故障“0-1-3-5”运维方案:故障提前预测、1分钟故障感知、3分钟故障诊断、5分钟故障修复。
陆海欧进一步解释,iMaster NCE实时采集网络设备的设备告警、网络KPI、服务SLA等多维数据,实时分析感知网络异常,输出故障事件;;通过智能诊断,给出网络异常的根本原因和修复建议。对于配置故障,可以通过控制器和管理器自动调整网络和服务,实现网络故障的分钟级自动闭环。
此外,基于长周期故障特征学习,iMaster NCE可以针对光纤亚健康、网络资源枯竭等潜在风险提前预测网络异常。
“0-1-3-5”故障运维方案的典型应用场景
传输网、IP网、家庭广域网等不同网络对AI网络感知分析和预测诊断有不同的需求。华为如何在不同的网络和业务场景下构建“0-1-3-5”故障方案?
对此,陆海欧介绍了华为故障“0-1-3-5”运维方案的精准预测、实时感知、智能诊断、智能修复等四个典型场景,以及实际效果。
场景1:光纤网络亚健康预测
光纤的可靠性和性能是通信网络的基础,一根光纤往往承载着大量的用户业务。除了工程建设、自然灾害等无法预料的因素外,光纤持续劣化导致的性能失效是业内长期存在的问题。
华为作为全球最大的光网络提供商,可以结合不同地区的网络数据,从而更全面地了解光纤线路的劣化特性。华为基于全球网络的统计特征、信号特征、模型特征,提取了10多个典型数据特征,综合应用5个模型聚合,通过集成学习算法,将预测准确率从单一模型的80%提高到90%。
此外,考虑到数据采集的准确性和带宽成本,华为创新性地引入了网元和网络两层分析能力。比如在网元上,实时采集了400多个光学参数,通过智能压缩等技术,实现了上报数据1:60的压缩比,且不破坏数据措施。
陆海欧还介绍,今年华为的iMaster NCE光纤亚健康预测方案,在江苏联通试点时,成功预测了两个月内1条OCH路径亚健康和2条光纤严重开裂。最后的结果都证明检测非常准确。
场景2:实时感知IP网络故障
IP故障定位非常困难。在一个真实的案例中,一家电信运营商遭遇了IP承载网络故障。当时运营商和合作伙伴投入了10多名运维专家,历时10个小时,最终定位到故障原因,是一个IP端口转发异常。
关于IP网络故障定位时间的问题,华为从IP设备实时感知、服务级SLA感知、网络健康感知三个维度努力提升IP网络故障实时感知。
具体来说,第一,在IP设备实时感知能力方面,华为IP设备支持iFIT检测能力,结合设备级AI能力,可以实时感知基站各业务流量和海量网元指标的异常。
其次,在服务级别SLA感知方面,iMaster NCE通过时间和空之间的聚类分析,识别出质量差服务的公共路径,选择质量严重差的服务,自动启动逐跳检测,分分钟就能找到故障点。
再次,在网络健康感知方面,基于对六大类8万多项网络指标的实时分析,iMaster NCE利用神经网络和动态阈值异常识别技术,可以识别90%的网络亚健康。
有什么效果?据陆海欧介绍,北京联通的IP移动承载网,通过部署iMaster NCE移动承载网智能分析解决方案,实现分钟级的群障定位,运维效率提升30%。
场景3:准确识别5G承载网络故障的根本原因
众所周知,基于设备告警的故障诊断仍然是日常运维中的主要处理手段。以5G承载网为例,一个典型的中国移动本地网,每天有上万个设备告警。大多数一线维护人员只能处理关键设备报警和紧急投诉;每天最多可以处理几百个工作订单。目前普遍采用静态的专家经验处理工单,容易漏报、误报,提供的故障位置信息不明确,导致很多工单无效。
华为iMaster NCE如何去除网络运维噪音,准确识别故障点?对此,陆海欧在峰会上介绍,华为iMaster NCE通过三个步骤实现了智能故障诊断。第一,降噪滤波。根据专家经验和告警规则,筛选海量告警,过滤掉80%以上的无效告警;其次,关联聚合。通过时间、地形和其他多维数据整合警报;最后,通过层次聚类算法,将分散的报警信息聚合成多组故障类别。
据陆海欧介绍,iMaster NCE可以通过机器学习和人工神经网络算法识别每个具体场景和根源报警,并给出维护建议,可以有效指导工单系统准确调度订单。
例如,郑州移动通过部署iMaster NCE智能事件管理方案,减少了99.8%的无效告警,与承载网相关的日常故障派单数量从600多个下降到400个左右。
场景四:家庭网络智能修复
全球疫情持续发展,在线办公、在线教育成为新需求,家庭网络的重要性进一步凸显。据统计,在过去的10个月里,家庭网络流量增长了70%,家庭宽度的投诉量也同步增长。其中,60%的投诉集中在家庭端,且大多与Wi-Fi有关。对于家庭网络问题,运营商往往通过安排上门维护来解决。上门维修一直存在成本高、预约难等问题。
对此,陆海欧介绍,影响Wi-Fi体验的问题主要有两类:干扰、漫游、配置问题,以及设备和连接问题。
对于第一类问题,NCE的云优化方案可以自动修复:NCE从AP收集网络KPI数据,识别终端设备的特性和漫游能力。然后通过大数据分析终端的7*24小时历史漫游行为,生成终端的最优漫游优化策略,并发送给网关,指导终端漫游,使Wi-Fi信号平滑切换。
对于第二类问题,NCE自动分析根本原因,并将分析结果推送到网关。当用户连接Wi-Fi时,会自动弹出门户,提示问题原因和修复建议,引导用户自行故障排除。
据悉,云优化和自助故障排除在家庭网络场景中的应用,有望平均减少10%左右的访问次数。
作者观察到,人工智能技术把简单留给了操作者。
将AI引入FBB网络,提高网络运维效率,降低成本,是运营商渴望的方向。这种需求不容易实现,所以对行业来说既是机遇也是挑战。
我们可以看到,华为通过引入云、网、设备三层AI架构,实施基于iMaster NCE、云NAIE、跨域智能运维AUTIN的“0-1-3-5”方案,在光网、IP网、家庭网维护方面取得了初步成效。
这个方案贯彻了华为的一个理念,就是“把简单留给客户,把复杂留给自己”。目前,全球运营商市场已经部署了超过1800套iMasternce,其中集成了约300套控制器。
正如陆海欧所说,“无论是网络演进还是新网络建设,华为建议运营商部署iMaster NCE控制器一体化目标方案,提升网络智能分析能力,逐步构建故障‘0-1-3-5’能力,实现运维转型。”
未来,FBB网络运维将变得更加复杂,运营商将更加重视网络智能分析,加快网络自动化和智能化的进程。可见,FBB网络自驾时代正在到来。