基于“五步法”排查4G基站主控板隐性故障的方法研究

2024-03-12 05:34古秋锦
广东通信技术 2024年2期
关键词:五步法主控板劣化

[古秋锦]

1 问题背景

在无线网络优化中场景中,导致用户质量感知投诉的原因是多样的,主要包括覆盖、容量、干扰、故障等。一般情况下,基站射频设备、主控板、基带板等硬件设备出现严重告警时,操作维护平台都会及时发现并处理[1]。然而,对于这些硬件设备出现一些隐性故障时,将很难被发现,直接导致无法及时修复故障问题,从而出现大面积用户感知异常,一直以来都是一个网络优化研究的难点。

结合相关问题,现分别从单小区/整站共性问题确认、传输问题排查、参数变更/故障原因排查、上/下行网络链路问题确认以及最终问题根因确定等5个步骤,介绍一种4G站点主控板隐性故障的排查方法[2]。

以 “深圳金銮国际E-HLW”站点为例,根据主覆盖区域用描述的无法进行数据业务和语音业务情况,用五步法进行排查。对问题小区进行KPI指标统计发现:“深圳金銮国际E-HLW-1”从4月10日开始,4G无线接通率、上行用户平均体验速率以及Volte丢包率明显劣化,与投诉时间点相匹配[3],如表1所示。

2 问题排查分析

结合相关问题,对“深圳金銮国际E-HLW”站点开展单小区/整站共性问题确认、传输问题排查、参数变更/故障原因排查、上/下行网络链路问题确认等排查,最终问题根因确定、五步法进行排查[4]。

2.1 步骤一:单小区/整站共性问题确认

首先,统计“深圳金銮国际E-HLW”整个站点所有小区4月初的“VoLTE上行丢包率”、“上行用户平均体验速率”明显出现同步劣化。综上,该投诉非单小区异常,属于共站小区的共性问题[5],如图1、图2所示。

图1 VoLTE上行丢包率变化

图2 上行用户平均体验速率变化

2.2 步骤二:传输问题排查

接着,结合网管相关“E-RAB建立失败”原因统计中,传输资源不足、传输层问题导致的次数都是0次,初步排除由于传输问题导致整站小区的劣化,如表2所示。

表2 深圳金銮国际传输指标变化

2.3 步骤三:参数变更/故障原因排查

同步在网管确认,“深圳金銮国际E-HLW”站点小区指标劣化期间,无参数调整记录、站点无影响业务的历史告警。

2.4 步骤四:上/下行网络链路问题确认

结合问题小区 RRC失败的原因集中在“UE无应答而导致RRC连接建立失败次数”、“其它原因导致的RRC连接建立被拒绝的次数”两个原因值。“深圳金銮国际E-HLW-1”小区RRC失败和E-RAB失败原因值统计[6],如表3所示。

表3 深圳金銮国际接入指标情况

空口“UE无应答”信令跟踪截图,如图3所示。

图3 UE无应答信令跟踪

查询“深圳金銮国际E-HLW-1”小区“下行MR覆盖”为98.60%左右,在指标劣化情况时无明显劣化情况,相关指标如图4所示。

图4 深圳金銮国际下行MR覆盖

查询“深圳金銮国际E-HLW-1”小区“上行干扰平均值和最大值”在指标劣化前后明显发生变化,干扰变强了8 dB左右。相关指标如图5所示。

图5 深圳金銮国际上行干扰变化

综上,初步判定空口“UE无应答”信令主要由于终端收到RRC CONN SETUP消息,并发出RRC CONN SETUP CM消息后,由于上行质量异常、基站侧无法接收到相关消息,导致RRC连接“UE无应答”超时[7]。

进一步查询,深圳金銮国际E-HLW-1小区PUSCH上弱覆盖占比、平均值、最大值等指标,在投诉出现前后均明显劣化,如表4所示。

表4 深圳金銮国际投诉前后指标变化情况

从上/下行PRB利用率差值来看,“深圳金銮国际E-HLW-1”小区上行质量异常,导致上行数据重传较多、上行PRB利用率明显大于下行PRB利用率现象,如图6所示。

图6 深圳金銮国际上/下行PRB差值

2.5 步骤五:最终问题定位

将“深圳金銮国际E-HLW”站点的“时钟检测增强开关”设置为ON后,站点同步出现主控板(UMPT)单板硬件故障告警。详细截图如图7所示。

图7 深圳金銮国际重要告警查询结果

综上,“深圳金銮国际E-HLW”站点小区语音业务、数据业务使用异常的投诉,主要是由于主控板(UMPT)单板硬件故障,引起上行链路质量突发劣化导致[8]。

3 优化方案及措施

4月24日,维护同事现场更换“深圳金銮国际E-HLW”站点主控板后,整个站点小区“上行干扰电平”、“上行PRB与下行PRB差值变化”、“上行RTP丢包”、“无线接通率”和“上行速率指标”等指标均恢复到投诉出现之前的水平,达到预期优化效果,回访投诉用户均得到数据业务和语音业务感知均恢复正常的回复[9],详细优化前/后各项指标对比,如图8、图9、图10、图11、图12所示。

图8 上行平均值、最大值优化对比

图9 上行PRB与下行PRB差值变化对比

图10 上行RTP丢包对比

图11 无线接通率对比

图12 上行速率变化

4 全网同类问题排查和应用效果

同类问题点如深圳南光城市花园,现场测试负1楼、负2楼停车场室内4G小区占用“深圳南光城市花园E-HLW-1”,终端信号RSRP在-78~-92 dBm左右,下载速0.22 Mbit/s,上传速率0.12 Mbit/s,上传下载速率慢,无法正常通话,用户感知差[10]。

按照 “五步排查法”进行隐性故障分析,最终定位亦是由于站点“深圳南光城市花园E-HLW”主控板(UMPT)单板硬件故障,导致用户上/下行速率感知异常引起投诉。经更换板件后,“深圳南光城市花园E-HLW-1”小区各项感知指标恢复正常,投诉问题得到解决,达到预期效果,如表5所示。

表5 深圳南光城市花园换板前后指标

5 总结推广

在无线网络优化中,若无线基站硬件设备出现一些隐性故障时,将很难被发现,直接导致无法及时修复故障问题、出现大面积用户感知异常,一直以来都是一个网络优化研究的难点。结合4G站点主控板存在隐性故障导致周边用户感知差投诉问题,针对性的从单小区/整站共性问题确认、传输问题排查、参数变更/故障原因排查、上/下行网络链路问题确认以及最终问题根因确定等5个步骤,形成一种4G站点主控板隐性故障的排查方法。同时,同步对全网同类问题进行排查和应用,应用效果明显。

猜你喜欢
五步法主控板劣化
一种快速可靠的主控冗余及切换机制的设计与实现
基于S形试件五轴数控机床动态性能劣化评价
升级双主控板交换机ISO
跨海桥梁混凝土劣化分析及预养护
谈写字教学“五步法”
“五步法”战胜公开发言恐慌症
谈谈师范生排演课本剧的“五步法”
变频器检测台的设计、制作及主控板的维修
IFRS15对通信行业收入处理的影响研究
八钢2500m3高炉适应焦炭质量劣化的生产实践