机房基础设施监控系统的应用与实践

2024-04-01 06:41郭振明
电视技术 2024年1期
关键词:网点机房运维

郭振明

(南京市浦口广电网络有限公司,江苏 南京 211800)

0 引言

南京市浦口广电网络有限公司机房数量多、分布散。截至2022 年,辖区内包括中心机房1 个,无源机房222 个,有源机房108 个,大部分机房为无人值守机房。其中,中心机房主要承载全区的数字电视、宽带及专线等业务,下辖网点机房主要承载所辖片区的所有业务。当前,针对这些机房的管理具有以下痛点:机房数量多、分布散,出现问题后不能及时发现,对发生的风险无法及时应对;网点机房多,运维人手不足,运维人员能力参差不齐,缺乏管理手段;资源利用率低,未能合理有效地管理、利用网点机房资源。对此,通过建立一套监控系统对所有网点进行全面集中的监控管理,能够实现网点机房一体化、集中化、在线式监控管理。设计时,需充分考虑整个系统的扩展性,以便将来的升级和扩容。

1 项目意义

机房基础设施监控系统对于确保机房稳定运行和数据安全具有重要意义。本次项目通过制定适当的监控方案,选择合适的监控设备,建立完善的监控系统,确保机房的安全和稳定运行。监控系统主要实现以下4 个目标。

第一,提高安全保障。网点监控可以保障网点的安全,通过监控设备对网点内部和周边环境进行实时监控和录像,及时发现异常情况,如盗窃、破坏、火灾等,从而采取相应措施,防止和应对安全风险。

第二,提升资源利用率。网点监控有助于有效管理和利用资源,通过监控设备,实时了解网点的工作状态、人员流动情况以及资源利用情况,从而进行合理的资源分配和调配,能够提高资源利用效率,减少资源浪费[1]。

第三,提高运营效率。网点监控可以提高运营效率。监控设备可以帮助管理人员更好地了解网点的运营状况,及时发现问题,并采取相应的措施来解决或优化,从而提升网点的运营效率和服务质量。

第四,防范风险。网点监控可以帮助预防和减少风险。通过监控设备,及时发现潜在的风险因素,防止风险事件的发生,保护机构和员工的利益。

2 监控范围

针对浦口广电机房现状,为了实现各级机房的统一监控管理,南京市浦口广电网络有限公司经过近年来对系统的不断建设、改进、升级,形成了一套完善的管理系统。

2.1 中心机房

中心机房基础设施监控系统于2017 年开始建设,2019 年正式交付使用。项目架构如图1 所示,建立了包括机房动力、环境、安防及消防的一体化监控系统,实现7×24×365 的全面集中监控和管理,保障机房环境及设备安全高效运行,以提高机房可用性,降低机房运维管理难度[2]。

图1 中心机房系统架构图

2.2 珠江新机房

珠江机房于2018 年异地搬迁重建,本次新建的机房在原有系统基础上完善,架构如图2 所示。珠江机房采用现场采集器将珠江新机房数据上传至中心机房管理平台。

图2 珠江机房接入架构图

2.3 网点机房

网点系统建设采取逐年建设、逐步完善的方式,于2018 年底开始建设,分3 年建设网点机房基础设施及安防监控,搭建完成后实现全网点集中监控管理[3],最终架构如图3 所示。

图3 网点集中监控管理架构图

3 架构分析

最终系统由现场采集层、区域监控层、采集监控层和远程浏览层4 层架构组成。系统采用扁平化、简洁化的分布式采集,集中式监控部署架构,保证监控系统数据采集、存储的可靠性和稳定性。

现场采集层由采集器、各种采集传感器及视频录像等设备组成。采集器连接所有传感器和被监控设备,实现上层系统与被监控对象的数据通信。采集器具备数据处理、过滤及缓存功能,降低集中监控平台的运算负担,并在出现突发状况时保障数据存储的完整性。区域监控层负责汇集中心机房的各种信息并上传至集中监控平台。监控平台具备数据的存储、处理、分析和展示能力。采集监控层将现场采集层设备传来的各种信息进行存储、处理、分析和展示。远程浏览层支持Web 浏览器、移动终端等多种方式访问系统平台,实现页面查看、页面配置、告警配置、报表配置、权限配置及系统配置等管理功能。

4 平台搭建过程遇到的问题和解决办法

基础设施监控平台从2016 年底提出建设,直至2020 年建设完成。这3 年中,系统不断完善更新,最终得以交付使用,从无到有的过程中,有很多值得总结的地方。

第一,集成难度大。与各设备供应商进行沟通确认,协助监控厂家获取设备通信协议,并要求监控厂家提前开发设备协议,节约现场调试时间,提高工作效率[4]。

第二,网点分散。为了更好地实施方案,提前与监控厂家及片区负责人做好沟通,协助厂家规划好实施路线,节约双方时间,提高完工效率。

第三,实施工艺标准化。该项目是交钥匙工程,没有人员陪同监控厂家到每个现场进行设备安装,因此在安装前先找一个点进行确认,当作样板工程,以便统一安装工艺和标准。

第四,网际互连协议(Internet Protocol,IP)地址需求量大。网点监控、门禁、视频均需要使用IP地址,提前合理规划IP 地址,到现场后直接按点表进行配置,同时针对机房区位以及后期规划进行合理地址冗余,有利于后续出现问题时的故障定位。

5 系统平台特点

该系统的搭建,实现了网点机房一体化、集中化的在线式管理,解决了网点机房数量多、分布广、设备品牌繁多等问题,便于对各层级机房进行及时可靠、科学经济的监控管理。系统主要有以下几个特点。

5.1 统一监测

平台将分散的、相互独立的网点机房用相同的环境、相同的软件界面进行集中监视。不同专业、部门的运维人员可以通过办公电脑查看系统画面,并且根据区域的不同实现本地存储,覆盖所有网点基础设施,全线感知各网点在线情况及运行动态,网点供配电、环境、安防等统一监控,健康状态一览无余[5]。

5.2 跨网点联动

平台实现所有网点数据汇总。各个网点实现标准化,通过平台实现信息互通,但又相对独立、互不干扰,从而达到提升自动化管理及运维水平的目的。

5.3 辅助巡检功能

网点监控管理平台充分联动各个网点机房,通过布设巡检管理功能模块,再结合定制化的页面分析、故障影响模型等功能,极大地提升运维的精准性,提高管理效率。

5.4 准确定位

平台定制地理信息系统(Geographic Information System,GIS)地图,做好拓扑结构、分层管理工作,呈现网点状态,实现准确定位,按照网点告警级别、告警类型过滤显示网点,实现故障站点快速定位,快速获取站点信息。通过设置多级预警阈值,分析数据发展趋势,提前预警。支持定时报平安、告警过滤、升级及根源分析等告警决策功能,提升机房运维人员解决故障的效率[6]。

该系统极大地降低了小区节点安全事故的发生概率。在重大活动安全保障期间,各片区的运维人员每天登陆动环网管系统进行各节点机房巡查工作,节省大量人力巡查的同时,能够及时发现机房内温湿度的变化和外界对小区机房的侵入事件,大大降低了运营成本。

6 结语

当前,有线系统正处于数字化转型发展全面启动的阶段。只有坚定不移地加强技术创新、提升数据质量以及发挥科技引领作用,提升运维管理水平,才能真正用科技进行运维管理和服务大众。

猜你喜欢
网点机房运维
快递网点进村 村民有活儿干有钱赚
于细微之处见柔版网点的“真面目”
运维技术研发决策中ITSS运维成熟度模型应用初探
风电运维困局
杂乱无章的光伏运维 百亿市场如何成长
优化内部劳动组合 释放网点营销潜能
基于ITIL的运维管理创新实践浅析
N通信公司机房节能技改实践
新型有线电视机房UPS系统的配置
大功率发射机房冷却送风改造