写点什么

5G 网络行业切片 SLA 初探

作者:鲸品堂
  • 2022 年 9 月 26 日
    江苏
  • 本文字数:3521 字

    阅读完需:约 12 分钟

5G网络行业切片SLA初探

“店长,你们 58 元工作餐送一杯咖啡,结果是一包速溶咖啡,真的好忽悠!”某西餐厅里,一位客户不满地说道。客户看到菜单里赠送的咖啡,立刻脑补了一杯热气腾腾的现磨阿拉比咖啡,但店长却想着“赠送的,用雀巢速溶咖啡就不错了”。结果换来的是某团上的差评。


“李经理,我们园区的 5G 摄像头上不了网了,什么时候可以恢复啊?”某工厂客户着急地打电话。“我刚看了下系统,你们的故障是 18:30 发生的,应该是刚才的雷暴天气导致基站故障。您购买的是我们的 VIP 级切片,可以享受 7×24 小时保障,故障修复将不超过 2 小时。现在 19:05 了,我们的工程师在半小时前就出发了,这会差不多就到你们厂了。放心,不用 1 小时网络就恢复了。”李经理安抚着客户,客户听李经理这么淡定准确的回答,着急的心情也慢慢平复下来。


上面的两个场景为何有如此反差?西餐厅里双方各自想当然,服务没有明确定义,争执不断。园区的客户在购买运营商的网络切片时,合同上定义了明确的服务内容。这就是 SLA,在客户和服务提供商之间建立一套标准的服务规约,让双方能在一个频道进行问题的高效沟通。


SLA 价值为何


随着 5G 切片+边缘云的不断融合发展,5G 切片技术服务更多的垂直行业,才能获得更大的收益。据 GSMA 预测,中国未来五年的工业制造、交通物流等行业的市场规模超万亿,且 60%的市场新增价值在政企客户,未来 5G 专网市场空间潜力巨大。

   

 

典型的 5G 切片应用场景


在企业数字化转型过程中,5G 专网业务将面临服务范围更广,客户需求多样,对 5G 专网运营带来了更高的挑战。通过定义 5G 切片 SLA 将对运营商运营带来以下的价值:


  • 明确责任:明确运营商和客户的各自责任范围,避免在出现问题时引起纠纷。例如对客户机房、客户终端发生故障而引起业务故障运营商可免责、故障处理时间也可进行相应的剔除。

  • 服务聚焦:售前中后服务更加聚焦,重点关注 SLA 指标执行情况,更快响应跟踪、处理问题。例如专享切片网络的 20ms 时延达成率是 99%,那么大客户运维就盯紧上下行时延的日均值峰值。

  • 运营优化:在运营商管理成熟和业务量达到⼀定的规模时,还可以根据 SLA 指标的达成情况,及时调整运维策略降低成本。例如根据网络保障等级,X 级以上业务才会在非法定工作日安排故障处理,以减少运维人员的加班成本支出。


SLA 真身显现


参考业界成熟的 ITIL 标准,我们对网络服务的 SLA 进行如下定义。


服务目录

服务目录决定了服务范围,只有合同范围内的服务⽬录,服务商才会有后续的保障。服务目录要素包括服务测量指标 SLI(service-level index)和服务等级目标 SLO (service-level objective)。行业切片的常见 SLI 如开通时限、恢复时限、时延、可用率等。SLO 描述了不同等级所提供功能的一种期望状态,如切片可用率对应普通级别为 99.9%,对应高级别为 99.95%。


服务日历

服务⽇历是合同中 SLA 约束的服务时间范围,即为客户提供 X*X 的服务响应期,是 7*24 还是 5*8,是否扣除⼀个周期内的法定假期,在运维保障中是需要完全对应上的。


恢复时间

恢复时间是指当发⽣各种类型的会影响 SLI 测量值的事件时,运营商采取措施恢复服务的时间。其组成包括响应时间 TTO(time to own )指从发现到指派处理所用的时间;解决时间 TTR(time to resolve),指接单处理到服务完全恢复所用的时间。


恢复时间与 SLO 之间并不是一个简单的阈值控制,⽐如 SLO 定义了⼀年之中宕机时长<10 个⼩时,但不能同一次故障里把 10⼩时⽤完。恢复时间⾥定义了宕机属⼀级故障(解决时限 1⼩时),这样会强制把 10 个⼩时分散到一年,以减少对业务的冲击。


SLA 在垂直行业中


指标测量


SLA 不仅要有目标,还要随时监控,这些都离不开指标的准确和及时测量。SLA 指标包括服务类和网络类两种。


服务类主要是勘察、开通、故障、投诉等售前中后相关活动事件的有关响应时间、解决时间,这类 SLI 一般可通过对接 OSS 网管中台的编排/故障/运维中心获取到时间数据。


网络质量类指标测量的准确性、完整性、及时性,直接关乎 SLA 是否能准确履约和运营的效用。下面,我们就对切片网络指标的多种测量方案进行逐一介绍。



网络质量指标测量方案


  • OMC 测量:通过 OMC 进行周期性的采集,可获取流量、时延、丢包等统计类指标。理论上可以获取到单用户级 MR 数据,但因为涉及用户位置等隐私数据,一般情况下大网是不开放的。对于归属用户专有基站,可在数据不出场的情况下进行测量获取。优点是现网基本具备,缺点就是时间粒度粗(15 分钟)、切片/DNN 级(一般无号卡用户级)、没有业务应用类指标测量能力。

  • 大数据测量:通过对用户每次网络交互报文进行抓取分析。报文包括 N1 和 N4 接口控制信令日志,以及 N3 接口的业务流 DPI。优点是可提供用户业务操作级数据,可精准测量每次网络交互;缺点就是成本高,需专门的服务器硬件和网络分光器。特别对专享尊享切片,UPF 园区内部署数据不出场的场景,N3 接口业务流无法在运营商大网上获取到数据。

  • 终端测量:随着 R16 标准的冻结,网络和模组的测试能力也随之增强,例如 QoS monitoring 允许我们自主下发指定终端的上下行时延测试。特别是行业客户对终端有完全的自主权,可根据应用场景定制软探针,从客户角度对运营商的网络质量履约进行验证确认。优点是灵活可控、易于扩展,缺点就是高频测量可能会影响业务正常使用。


智能保障


对各垂直行业的 SLA 管理,不仅要考虑 SLA 指标的监控需求,还要考虑如何进行保障以确保业务的正常状态。行业切片应用中 SLA 指标专业性强、数据量大、测量复杂、可用性要求高。通过自动化的业务运维保障闭环,实现行业切片 SLA 的可靠守护。


在省级政企客户运维的项目中,我们建立通用的 SLA 指标质差规则模型,通过质差识别、质差治理和优化验证框架,完成 SLA 质差的智能保障。SLA 智能保障处理过程参考如下:


  • 对 SLA 指标进行分解得出网络层面可测量的原生指标,对这些原生指标建立自动采集和监控的预警机制。

  • 通过多种原生指标的异动偏差组合分析,推导出业务质差场景,触发质差定界定位流程。

  • 通过切片实例的网络资源树,找出切片的终端、无线、传输、承载、核心网、边缘云的网络实例,分别在各段各层网络查找问题,汇总并得到定界结论。

  • 尝试对问题的自动修复,包括基站 PRB 比例增加、异常 UE 剔除出网、UDM 和 PCF 上用户配置数据修正等。

  • 需现场处理的情况,自动派单到运维管理系统,通知切片的运维负责人。

  • 待上两步处理完后,继续对原生指标进行监控,以确认指标劣化偏离状态恢复正常。


上述只是基于规则分析的自动化 SLA 保障手段,随着 AI 智能的应用,SLA 的智能化保障方案也在逐渐的丰富和成熟。通过导入海量的关联终端、基站、回传、核心网数据,通过机器学习推导出质量劣化模型,就可以在问题发生前进行预测,为各种保障工具的实施争取更多的时间,智能识别质量隐患点,并在质量问题发生前进行定点优化。


采矿行业实践


在 21 年某铜厂 5G 专网园区运维项目,我们对网络和业务的 SLA 指标(包含工业控制类指标)进行深入分析,实现了指标实时测量和汇总计算,同时结合数字孪生技术对无人工厂进行数字化还原和监控。


铜厂洗矿车间由于粉尘非常大,人员在现场操控非常不健康。为建成无人洗矿车间,需要 4K 高清视频监控,以及对皮带传送机和天车等机器进行远程控制。


高清视频监控切片:主要传输洗矿车间监控的大视频类数据,使用 4K 类视频监控,上行带宽满足 40Mbps 即可;时延要求普通不高,约 50ms;视频卡顿率和花屏率要求比较高,需小于 0.1%。

机器控制切片:主要进行天车和皮带运行的远程控制,传输内容主要以信令控制为主,对于上下行带宽要求不高,2Mbps 即可;对于时延和丢包要求非常高,时延通常小于 10ms,丢包率小于 0.01%,PLC 执行成功率大于 99.9%。



车间层面和业务(天车)关键 SLA 指标监控


在本次采矿行业的 SLA 实践中,我们建立了一套完整的采矿行业 SLA 指标模型,包括集团-分公司-车间-天车(业务)的多层级 SLA 指标模型,关键指标数据包括 5G 网络类指标、工业控制类指标和设备实时运行类指标。


基于天车业务控制类指标和设备实时运行指标,我们还通过 3D 仿真建模,实时显示运行动态,让用户可实时了解设备运行情况。我们首先通过对设备尺寸等静态数据进行采集,再通过 PLC 上的各个方向上运动速度数据,还原出设备的实际位置位移数据,最终还原出设备的实际工作过程。


展望


5G 行业融合应用已经进入到关键探索期,5G 切片 SLA 分级管理和保障是行业落地应用和规模推广的重要前提,我们将持续研究 5G 切片 SLA 的模型设计、高精测量、智能预测、智能保障等技术,实现 5G 技术的全行业应用百花齐放。


在未来不遥远的 6G 时代,控制面时延将达到 1ms,用户面时延将达到 0.1ms,流量密度将达到 0.1-10Gbps/m2,连接数密度将达到 0.1-1 亿设备/km3。业务场景包括沉浸式交互、云 XR、全息通信、通感互联、智慧交互、数字孪生,空天地海一体化通信系统,全球无缝立体覆盖,用户随时随地接入。场景的丰富和指标需求的提升,需要更清晰可信的 SLA 提供保障。

发布于: 刚刚阅读数: 5
用户头像

鲸品堂

关注

全球领先的数字化转型专家 2021.03.16 加入

鲸品堂专栏,一方面将浩鲸精品产品背后的领先技术,进行总结沉淀,内外传播,用产品和技术助力通信行业的发展;另一方面发表浩鲸专家观点,品读行业、品读市场、品读趋势,脑力激荡,用远见和创新推动通信行业变革。

评论

发布
暂无评论
5G网络行业切片SLA初探_5G_鲸品堂_InfoQ写作社区