5G SA用户的短信接收容灾方案研究与实践

2024-04-17 14:08阎艳芳郝双洋邵斐杨姣
数字通信世界 2024年3期
关键词:容灾投递IP地址

阎艳芳 郝双洋 邵斐 杨姣

摘要:当VoLTE短信网关主用数据中心(DC)发生故障切换到容灾DC时,在用户刷新注册前,容灾DC收到短信中心下发的手机终呼(MT)消息会通过3G电路域网络完成消息终呼。但5GSA用户只附着在5G核心网络,无法通过3G电路域网络下发短信。随着5GSA用户的快速发展,需要解决VoLTE短信网关容灾切换后5GSA用户不能及时接收短信的问题。另外,当IMS网络中服务呼叫会话控制功能(S-CSCF)节点发生容灾倒换时,4G用户可通过回落至3G电路域进行短信的再投递,而5GSA用户在没有重新发起新的注册请求前,由于没有3G电路域注册信息,也无法从3G电路域接收短信。文章阐述了当VoLTE短信网关单DC故障和核心网S-CSCF发生故障时,5GSA的容灾问题。

关键词:VoLTE短信网关;DC容灾;5GSA用户;MT短信;容灾倒换

doi:10.3969/J.ISSN.1672-7274.2024.03.012

中图分类号:TN929.5          文献标志码:B           文章编码:1672-7274(2024)03-00-04

1   研究背景

在2G/3G传统电路域中,短消息业务由短消息服务中心(SMSC)提供,业务流程均承载在七号信令网上。随着VOLTE网络的商用,为VoLTE用户继续提供短消息业务,成为运营商在网络演进过程中必须支持的功能。VoLTE用户使用VoLTE短信网关实现IMS域SIP消息与短信中心MAP信令的转换,从而实现VoLTE用户的短信收发等业务[1]。

在4G网络时代,用户在4G的EPC、IMS域注册的同时,会发起联合位置更新,注册至3G的MSC上。当VoLTE短信网关发生故障时,根据IMS域的域选功能,短信业务可以回落至3G电路域,由用户注册的MSC进行转发,同样地,当IMS域的S-CSCF发生故障时,VoLTE短信也回落至3G电路域,由3G网络进行发送[2]。

随着5G网络的发展,5G SA用户呈逐步增加状态,目前在各运营商中的占比越来越多。因5G SA网络的特殊性,当用户处于5G SA注册及网络覆盖时,只注册在5G核心网络上,不做联合位置更新,无法附着于3G电路域网络。由于5G SA用户的这种特性,在以下两种场景下会出现较长时间的无法接收短信情况。

(1)场景一:VoLTE短信网关主用DC发生故障,业务全部切换到容灾DC,5G SA用户无法接收短信。

(2)场景二:VoLTE网关运行正常,用户注册的S-CSCF设备发生故障时,对于5G SA用户的MT短信,VoLTE短信网关通过该S-CSCF无法投递成功,按流程再向3G电路域投递时也无法成功,会出现用户短信暂时不可达的现象。在用户进行重注册时消除(此时用户重新注册到了可用的S-CSCF),最长时间情况为一个注册周期54分钟。

本文中研究了这两种场景下,5G SA用户的MT短信容灾实现方案,保障用户能够及时接收短信。

2   VoLTE短信网关容灾切换方案

2.1 VoLTE短信网关容灾组网架构

VoLTE短信网关分大区集中部署,各大区按云化双节点方案建设,两个节点在本大区内部互为容灾备份,分别与所管辖省的IMS核心网、HLR/HSS/UDM、短信中心(SMSC)连接。该容灾方案可以满足任一大区VoLTE短信网关现网单节点系统和业务出现严重异常状况或故障时,将其上业务迅速切换至对应容灾节点的要求,确保用户感知迅速恢复正常[3]。

在VoLTE短信网关终呼时,主用DC發生故障,切换到容灾DC,在原主用DC用户刷新注册前,容灾DC侧的VoLTE短信网关没有原主用DC上该用户的注册信息。在用户刷新注册前,容灾DC收到短信中心下发的MT消息,会通过3G电路域网络完成消息终呼。但5G SA用户只附着在5G核心网络,无法通过3G电路域网络下发短信。随着5G SA用户的快速发展,需要解决VoLTE短信网关容灾切换后5G SA用户不能及时接收短信的问题。

VoLTE短信网关在收到未注册用户MT短信时,需要查询被叫用户归属的3G电路域CF地址,完成消息下发。

2.2 VoLTE短信网关查询被叫归属CSCF要求

VoLTE短信网关根据被叫号码可以从电话号码映射(ENUM)/域名解析服务器(DNS)中查询被叫的问询呼叫会话控制功能(I-CSCF)地址,通过I-CSCF完成消息下发。因VoLTE短信网关消息量比较大,不同被叫号码都要到ENUM/DNS做NAPTR查询,影响ENUM/DNS性能。建议通过HSS获取用户S-CSCF主机名,配合CSCF的默认端口号完成VoLTE短信下发。支持通过UDR查询被叫S-CSCF地址,如图2中流程3、4所示。

VoLTE短信网关从HSS获取CSCF主机名后,支持查询DNS获取CSCF的IP地址。如图3中8~10流程表示,如果HSS没有返回端口号,使用CSCF默认端口号完成消息下发,如图3中2~7所示。

(1)IMS域消息下发失败后,继续原规范中3G电路域消息回落。

(2)如果S-CSCF发生故障,心跳检测失败,VoLTE短信网关则通过I-CSCF完成消息下发。I-CSCF接收到MT消息后,会根据IFC选择可用的S-CSCF完成消息下发。

2.3 关键技术要求

在配置VoLTE短信网关时,需要配置S-CSCF和I-CSCF的池组(POOL)名称,即SRV查询名称。针对S-CSCF和I-CSCF查询过程如下:通过查询S-CSCF POOL名称,可以返回所有S-CSCF主机名和端口号,再对返回的S-CSCF主机名做A/AAAA查询,可以获取S-CSCF的IP地址,A对应IPv4查询,AAAA对应IPv6查询。在VoLTE短信网关容灾后,业务处理机从HSS获取S-CSCF主机名后,发给UPSIP,UPSIP根据DNS返回的IP地址和端口号,完成IMS短信的下发。

3   S-CSCF发生故障时5G SA用户短信投递方案

3.1 方案介绍

因5G SA网络的特殊性,当用户处于5G SA注册及网络覆盖时,无法附着于3G电路域网络。这样,如果用户注册的S-CSCF设备发生故障,对于5G SA用户的MT短信,IP短信网关通过该S-CSCF无法投递成功,按流程再向3G电路域投递时也无法成功,会出现用户短信暂时不可达的现象。该现象在用户进行重注册时消除(此时用户重新注册到了可用的S-CSCF),最长时间情况为一个注册周期。S-CSCF的这种故障对其他用户短信投递无影响。为了尽量避免S-CSCF发生故障时对5G SA用户的影响,考虑采用IP短信网关检测S-CSCF状态的方式进行处理。当发现某一S-CSCF完全不可用时,将发往该S-CSCF的5G SA用户的MT短信转发给该用户对应的I-CSCF,由I-CSCF重新进行S-CSCF的选取及短信投递,从而解决5G SA用户问题;对于其他用户,仍采用原处理流程,使用3G电路域投递方式。

通过注册识别5G接入用户并进行标记,IP短信网关在进行MT短信投递时使用S-CSCF域名进行处理,IP短信网关定时检测当前使用的所有S-CSCF的状态,当发现某一S-CSCF完全不可用时,将发往该S-CSCF的5G SA用户的MT短信转发给该用户对应的I-CSCF,由I-CSCF重新进行S-CSCF的选取及短信投递,从而解决5G SA用户问题;对于其他用户,仍采用原处理流程,使用3G电路域投递方式。

3.2 方案实现

为了尽量避免当S-CSCF发生故障时对5G SA用户的影响,考虑采用IP短信网关检测S-CSCF状态的方式进行处理。

(1)5G用户标记。当用户进行注册时,通过识别注册信息中P-Access-Network-Info头域,将携带3GPP-NR-FDD/3GPP-NR-TDD(可扩展)标签的用户标识为5G用户,以便后续进行有针对性处理;其他用户保持不变。

(2)域名投递及S-CSCF检测。调整现有IP短信网关MT短信投递方式,由使用预先记录的S-CSCF的IP地址投递改为使用S-CSCF域名投递,以增强S-CSCF的可用性,避免在S-CSCF的单个IP地址不可用时出现5G SA用户短信投递问题。

同时,新增SPM模块用于对S-CSCF域名缓存及心跳检测,通过DNS查询获取S-CSCF的IP地址及端口信息,供Message消息下发使用,以减少极大DNS查询量。同时,SPM模块定时对当前S-CSCF域名下的地址及端口列表进行心跳检测,识别S-CSCF的可用性,当一个S-CSCF域名下所有IP地址均不可用时,将其标识为故障状态。

(3)S-CSCF故障处理。当发现S-CSCF处于故障状态时,IP短信网关将5G用户MT短信转发至I-CSCF,由I-CSCF进行重选路由,使用可用的S-CSCF进行用户短信投递。

3.3 方案分析

本方案相对于现有流程的主要差异在于:一是MT短信由根据S-CSCF的IP地址投递改为根據域名投递;二是对S-CSCF进行心跳检测,需要S-CSCF支持并开启接手心跳检测功能;三是当S-CSCF发生故障时使用I-CSCF进行重选路由投递。

其中,MT短信由根据S-CSCF的IP地址投递改为根据域名投递,由IP短信网关按配置进行DNS查询并缓存S-CSCF的IP地址列表。这种方式将增加少量DNS查询,大约数量为本大区使用的S-CSCF数量×间隔时间,整体对现有设备无影响。

关于IP短信网关对S-CSCF进行的心跳检测配置时间进行处理,可按每5秒进行一次S-CSCF检测,消息量很小,对现有设备无影响。

最后,当S-CSCF发生故障时,使用I-CSCF进行重选路由投递会对I-CSCF产生一定消息影响,数量取决于故障S-CSCF承载的5G用户在该注册周期内接收的MT短信,以一般I-CSCF的正常处理能力,对这部分消息增量应可正常处理。具体情况,也可为核心网进行确认。

综合上述流程差异的对比,建议使用该方案进行5G用户兼容S-CSCF故障的处理。

4   结束语

本文介绍了在VoLTE短信网关单DC故障和核心网S-CSCF故障两种极端故障场景下,5G SA用户因没有在3G电路域注册无法进行3G电路域短信重投递,导致MT短信长时间无法接收的容灾实现方案,分析了容灾实现业务流程及与现有流程的对比,为VoLTE短信业务的安全保障提供了有力经验借鉴,可在其他运营商推广。

参考文献

[1] 敬笑.VoLTE用户的IP短信业务实现方案[J].物联网学报,2017(3):68-71.

[2] 阎艳芳,谢冬秀,董俊涛,等.IP短信网关容灾方案研究[J].中国新通信,2020,22(17):13-14.

[3] 孙会玲,刘晓鸣,王玉玲.VoLTE短信组网方案浅析[J].山东通信技术,2016,36(4):39-41,45.

猜你喜欢
容灾投递IP地址
智能投递箱
传统与文化的“投递”
铁路远动系统几种组网方式IP地址的申请和设置
IP地址切换器(IPCFG)
基于SNMP的IP地址管理系统开发与应用
关于建筑企业容灾备份系统方案的探讨
公安网络中IP地址智能管理的研究与思考
基于中兴软交换的电力通信网络容灾系统建设
基于数据容灾技术在企业信息系统中的应用研究
大迷宫