“传输自动驾驶”的发展方向和演进目标

来源:优秀文章 发布时间:2023-01-22 点击:

季海峰 姚 程

1.中国移动通信集团江苏有限公司;
2.中国移动通信集团江苏有限公司南京分公司

TM Forum自动驾驶网络旨在面向消费者和垂直行业客户提供全自动、零等待、零接触、零故障的创新网络服务与ICT业务,打造自服务、自修复、自优化的通信网络,为通信网络运维数智化转型明晰了目标架构和实现路径。自动驾驶网络分级框架将网络自治化能力划分为“L0人工运营维护、L1辅助运营维护、L2部分自动驾驶网络、L3有条件自动驾驶网络、L4高级自动驾驶网络、L5完全自动驾驶网络”六个级别。参考TM自动驾驶网络理念,规划网络运维数智化转型,加大自动化、智能化能力建设,以期实现2025年网络运维自治水平达到L4的整体目标。

1.1 整体框架

参考TM Forum自动驾驶网络层次化架构,结合生产实践,中国移动提出“四层三闭环”的内部实践目标框架,如图1所示。通过分层次构建体系化能力,实现全场景网络自治。

图1 自动驾驶网络目标框架

1.2 发展方向

根据客户规模、业务类型、运维流程、合作伙伴等方面的多重差异,中国移动建立统一的能力评估体系,以评促建,全面开展自治能力量化评估。如图2所示,分三步驱动能力水平从当前状态到目标级别进行迭代提升。

图2 自动驾驶网络迭代闭环

2.1 能力分级

面对在2025年力争达到自动驾驶网络L4的整体目标,中国移动对网络自治能力建设进行了全方位的思考、适用性探索与初步应用实践。在传输网专业分别根据不同的技术领域定义各自的能力等级。基于TM Forum自动驾驶网络分级框架的指导原则,结合网络运维管理评估实际需求,从指导IT系统实现角度,定义如下分级代际特征:(1)级别0:线下人工实现;
(2)级别1:人工实现,线上记录;
(3)级别2:自动实现,程序固化专家规则;
(4)级别3:自动实现,规则与功能解耦,可按需灵活配置;
(5)级别4:自动实现,规则结合AI,可持续学习、快速迭代;
(6)级别5:自动实现,规则顺应变化自动迭代。

将分级代际特征应用于核心能力集,细化得到每个核心能力集的场景化自治能力分级细则,提出基于“封顶就高”“加权平均”等聚合原则的量化评估模型,从最细粒度的核心能力量化评估结果,可按需聚合得到各场景、各专业、各业务自动化水平的综合量化得分的层次化分级评估体系,为全面评估当前能力、多维度综合分析水平差异、精准识别共性能力短板,提供有力支撑。

2.2 评估对象

按照中国移动自动驾驶网络框架3D模型的重点运维场景所明确的内容,传输网基于“6-11-37”场景的能力定义能力等级。6个一级场景域,包括:规划、建设、维护、优化、运营、资源管理;
11个二级核心场景,包括:网络规划、设计部署、监控排障、巡检、测试、网络分析、网络优化、业务开通、网络投诉、资源变更管理、资源数据管理;
结合传输网络专业和业务类别的特点,将二级运维场景进一步分解为37项运维核心能力集,作为场景化评估对象。

根据当前摸底的能力现状和传输网各层次的评级目标需要满足如下要求。

3.1 规划

(1)需求预测

L2:SNMP采集、Netconf配置。

L3:Telemetry海量数据上报、采集和分析。

(2)规划与仿真

L2:Netconf设备自动配置,IGP/BGP协议(邻居、协议状态、路由),SNMP采集接口/隧道/业务流量,BGP-LS采集网络拓扑。

L3:采集SR-TP隧道逐跳数据,支持500K隧道逐跳数据采集;
What-if网络故障仿真,支持5大场景的自动规划,界面可以自动生成报表;
容量预测、容量规划能力。

3.2 建设

(1)网络设计

L1:提供网络设计管理功能,人工在该管理界面可对网络进行规划,并支持输出网络规划结果。

L2:提供网络设计模板管理功能,基于人工设计的网络案例建立历史项目案例库,并将历史案例转换为设计模板供下次网络设计选择使用。

L3:提供网络设计模板联想功能,能够根据输入参数自动联想案例库中最优方案、最优参数,辅助进行网络设计工作。

L4:提供网络设计结果自动导入部署系统功能,网络规划结果输出后,通过标准接口导入给部署系统,完成设计到部署的过程。

(2)集成部署

L2:Netconf设备自动配置,SNMP管理。

L3:网元自动发现,免下站开通调测。

L4:系统对接,自动获取设计结果,自动部署。

(3)开局配置

L2:基于SSH/Telnet/Netconf配置接口、IGP、BGP、QOS等配置。

L3:基于L2能力提供相关调测功能。

L4:运营商可编程的模式生成配置,远程配置自动化,系统自动根据设计结果远程对空配置设备执行配置下发。

(4)网络与业务测试:见“运维-测试”。

3.3 运维

3.3.1 监控排障

(1)故障与隐患识别

L2:SNMP性能采集(接口统计、隧道统计、CPU、内存和光模块硬件状态)、BGP-LS拓扑收集和隧道状态上报。

L3:支持设备异常KPI分析上报;
日志异常识别能力;
In-band OAM随流检测,基于L2VPN/L3VPN业务流量,预测未来的流量,识别隐患。

L4:全量KPI异常分析,多模态数据关联分析能力;
对系统资源的智能预测;
配置异常识别与分析。

(2)定位与影响分析

L1:人工部署和升级,人工手工添加网元纳管。

L2:Netconf设备自动配置,SNMP管理。

L3:网元自动发现,免下站开通调测。

L4:系统对接,自动获取设计结果,自动部署。

(3)开局配置

L2:TWAMP、Ping、Tracert。

L3:In-band OAM逐跳上报和自动故障聚类;
海量KPI数据采集,用于故障根因分析。

L4:网络故障模型AI自学习;
关键业务保障分析,检测到业务质差,系统对网络进行调优,快速恢复业务。

(4)故障处理

L2:应急路由调整,人工通过系统修改路由配置。

L3:IGP、BGP、FRR做路由收敛和业务切换,SR-TP做业务路径调优;
设备支持表项回刷、芯片复位、单板复位等自愈恢复能力;
OMC支持系统自动调整业务路由(通断和质差),亚秒级收敛。

(5)场景化监控

L2:SNMP流量采集能力、告警和日志上报能力;
TWAMP链路时延检测能力;
OMC支持基于模板的监控,流量采集和监控能力。

L3:In-band OAM随流检测能力,OMC dashboard实时数据可视和GIS联动。

3.3.2 巡检

(1)故障与隐患识别

L2:设备支持巡检工具通过SSH/Telnet的方式采集设备信息,并通过规则对采集信息进行判断,识别设备硬件、配置存在的故障或隐患。

L3:支持设备异常KPI分析上报;
OMC支持数据可视。

L4:全量KPI异常分析,多模态数据关联分析能力;
对系统资源的智能预测。

(2)现场巡检

L2:SNMP采集,Ping/Trace连通性检测。包含电源、风扇、温度信息上报,OMC描绘设备面板图。

L3:设备支持巡检工具通过SSH/Telnet的方式采集线路相关信息,包括线路光功率、误码等。OMC支持报表查看。

3.3.3 测试

(1)网络测试和业务测试

L1:Ping/Trace能力检测链路丢包、时延,SNMP采集接口流量、协议状态、设备异常告警等。

L2:设备告警上报,Ping/Trace能力检测业务地址的丢包、时延、路径。

L3:支持设备异常KPI分析上报;
In-band OAM随流检测能力。

L4:全量KPI异常分析,多模态数据关联分析能力。

3.3.4 网络分析

(1)数据采集

L1:支持工具通过SSH/Telnet登录设备,执行数据采集命令。

L2:支持SNMP采集接口流量。

L3:Telemetry上报和采集。

(2)数据处理

L2:网络侧多维报表,分析网络采集数据,生成多维度报表。

L3:网络实时可视化,对网络状态实时感知和呈现,网络流量可视化,网络异常/故障可视化。

(3)数据分析

L2:性能采集阈值告警,基于制定规则的性能阈值,15分钟级感知;
TWAMP业务质量监控。

L3:In-band OAM业务质量监控;
性能多维分析;
对网络状态实时感知和呈现,网络流量可视化,网络异常/故障可视化。

3.3.5 网络优化

(1)方案制定

L2:通过系统自动配置SR-TP重路由策略,手工调整网络流量。

L3:SR-TP隧道基于质量流量自动重优化调优,通过系统自动重优化调优,包含时延和带宽。

(2)仿真验证

L2:人工通过工具调路由。

L3:基于SR-TP流量分析,进行网络SR-TP自动重优化调优通过协议级下发;
SR-TP、MTN交叉时延/带宽约束算路。

L4:SR-TP动态调整网络,下发前可在线仿真。

(3)资源变更:见“资源变更管理”。

(4)数据分析

L2:支持对于优化后的网络质量信息汇总展示,包括流量、时延、丢包、告警等信息。

L3:提供网络路径调优前后对比。

3.3.6 业务开通

(1)开通流程调度:见“资源变更管理-资源调度流程”。

(2)资源勘查

L2:基于SNMP、LAD或Telemetry进行数据采集。

L3:基于BGP LS、PCEP协议,实时对带宽/时延可视,三层路由拓扑可视,基于带宽和时延因子预评估选路。

L4:基于预评估结果,对网络资源池化分配,并进行预占用,包含网络链路带宽、时延。

(3)资源变更

L2:业务自动开通,通过OMC北向接口与OB域打通业务自动开通,复杂接口,需要感知网络细节(网络视角)。

L3:业务自动开通,通过简化接口,无需要感知网络细节(业务视角);
在线自动调速(BOD/BC、Qos)。

L4:开放可编程,运营商具备在线可编程定义业务发放能力。

(4)业务测试:见“测试-网络测试和业务测试”。

3.3.7 网络投诉

(1)投诉预警预测

L2:配置查询和分析。

L3:实时Topo,网络建模。

L4:基于AI模型在线训练,自动更新,自动识别和分析。

(2)投诉定位

L2:连通性检测,Trace定界。

L3:业务检测,In-band OAM随流逐跳检测。

L4:基于AI的故障定位定界。

(3)故障处理:见“运维-故障处理”。

3.4 资源管理

3.4.1 资源变更管理

(1)资源调度流程

L2:OMC北向接口,根据上层规则下发配置。

(2)变更设计

L2:网络基础状态收集。

L3:实时状态收集。

(3)硬件操作流程

L2:远程配置界面,板位图可视化。

(4)软件升级

L2:设备软件升级工具,用户逐台升级。

L3:设备软件自动升级,批量升级。

(5)网络数据配置

L2:FTP大包加载,Netconf配置收集,命令行采集设备流量、邻居、路由等信息用于升级前后结果比对;
支持Ping/Trace检查对比升级前后网络状态。

(6)网络测试:见“测试-网络测试和业务测试”。

3.4.2 资源数据管理

(1)资源数据同步程

L2:SNMP北向上报。

L3:REST北向接口采集资源,实时变更通知。

(2)数据核查

L3:北向接口采集资源,实时变更通知;
与资管系统在线分配资源。

L4:资源预分配,实时资管。

(3)资源拓扑

L3:北向接口采集资源,实时变更通知。

对于传输网来说,2022年网络自动驾驶已达到L2级,2025年网络自动驾驶需演进到L4级,在此目标的牵引下,本文结合业务场景,展望了传输网的发展方向,识别和分析了传输网的差距,明确了传输网各层次的演进目标。针对后续提升各层次的自动驾驶网络水平,本文提供了具体的可落地的措施与目标,希望在后续的推进过程中,逐渐明晰网络自动驾驶水平L4级别的能力要求,与其他专业取长补短,不断更新传输网的能力要求。

猜你喜欢 传输网时延自动 自动捕盗机学生天地(2020年5期)2020-08-255G承载网部署满足uRLLC业务时延要求的研究通信电源技术(2020年8期)2020-07-21铁路传输网与数据通信网以太网接口MTU参数研究铁道通信信号(2020年8期)2020-02-06通信传输网中的监控技术应用电子技术与软件工程(2019年1期)2019-11-30《舍不得星星》特辑:摘颗星星给你呀花火B(2019年3期)2019-04-27浅谈5G带给传输网的挑战中国新通信(2019年23期)2019-03-27基于GCC-nearest时延估计的室内声源定位电子制作(2019年23期)2019-02-23基于移动站的转发式地面站设备时延标校方法宇航计测技术(2018年3期)2018-09-08让小鸭子自动转身小天使·一年级语数英综合(2017年3期)2017-04-25自动摇摆的“跷跷板”莫愁(2017年9期)2017-04-07推荐访问:演进 传输 驾驶
上一篇:5G天线Massive,MIMO智能优化的研究与应用
下一篇:数据融合背景下智慧楼宇技术架构与应用的思考

Copyright @ 2013 - 2018 优秀啊教育网 All Rights Reserved

优秀啊教育网 版权所有