网络机房搬迁规划及工程实施

2024-05-10 17:22吕航王青
中国新通信 2024年2期
关键词:规划

吕航?王青

摘要:随着办公信息化水平的提高,网络机房作为数据存储、计算和传递中心,其应用逐渐普及。然而,由于各种原因,如机房设备老化、容量不足等,網络机房升级改造和搬迁时常发生。如何保证搬迁工作的顺利稳妥以及搬迁后机房的稳定可靠运行事关重大。因此,本文就网络机房搬迁规划及工程实施进行总结归纳,以期为网络机房的搬迁工作提供借鉴。

关键词:网络机房;搬迁;规划;工程实施

随着业务信息系统的更新换代和规模扩大,网络机房面积、计算存储硬件设备性能数量以及配套环境设施都不能满足用户需求。此外,选址重新规划或场地租约到期等原因,需要对网络机房进行搬迁。网络机房作为复杂系统,搬迁工作的规划、实施和搬迁后的恢复工作环环相扣,决定着搬迁工作的成败。因此,要系统筹划,坚持原则,以保证工作稳定安全推进。

一、搬迁原则

(一)安全性原则

搬迁过程应充分考虑人员安全、用电安全、消防安全,同时注重信息安全,做好数据备份,确保安全防护设备有效运行的情况下连通服务。

(二)可靠性原则

搬迁应有清晰明确的目标,并据此制定灵活多样的保障措施,通过流程管理和检验手段防止粗疏错漏,重视备品、备件抢修等保底手段。

(三)可控性原则

搬迁过程应充分考虑风险,做足应对预案,通过管理和技术的双重举措,确保过程可控,结果可控。

(四)可扩展性原则

搬迁规划应充分考虑功能分区,并且在此基础上为将来可能扩展的系统和设备预留足够的空间、网络接口、电源接口等,使机房保持整齐有序。

二、搬迁准备

(一)新机房准备

在搬迁工作开展之前,确保目标新机房的准备工作符合相应的标准,是成功进行搬迁的重要前提。以下是新机房准备的关键方面:

供配电系统:确保有满足使用功率要求的市电供应,并配置UPS不间断电源系统(Uninterruptible Power Supply);在机柜中安装数量足够的PDU电源分配单元(Power Distribution Unit),以满足设备的电力需求;对照GB50174-2017《数据中心设计规范》的机房等级,按需配备双路机房电源进线。

空调通风系统:根据当前和远期需求,选择容量适宜且具备扩展性的机房精密空调系统和新风系统。

综合布线系统:进行机房内部和大楼综合布线、楼宇间布线系统的规划和布设。

消防排烟系统:在关键区域(如主机房、电池室等)使用七氟丙烷气体灭火系统,同时设置手持灭火器作为备用。

安防系统:部署机房门禁控制和视频监控系统,确保机房的安全管理和监控能力。

动环监控系统:建立配电系统、环境(温湿度、漏水等)的监控系统,及时发现和处理潜在问题。

此外,还应考虑设计符合防雷接地、电磁屏蔽等要求的条件。根据预算和场地条件,可以选择采用模块化机房解决方案。

(二)搬迁前准备工作

为实现安全无损搬迁,需要做好充分的准备工作。

1.工具、耗材和备品备件准备

搬迁实施过程中用到的工具主要有光纤熔接机、网线钳、标签打印机、光纤测试笔、光功率计、网线寻线仪、螺丝刀、剪刀等;用到的耗材主要有光纤跳线、光模块、网线、阻燃尼龙扎带等;用到的备品备件需要根据搬迁对象的新旧程度、风险点准备,主要包括路由器、交换机、硬盘、内存、光纤收发器等。

2.旧机房的踏勘

主要包括机房内设备清单及对应状况、网络拓扑梳理、端口连接关系统计、业务统计和设备的软硬件对应关系、机柜设备布局图绘制,以及对整体用电、散热量、重量等估计。通过进行上述工作,可以为搬迁策略制定和后续维护提供准确的基础信息。在进行踏勘时,主要使用查询直观法、顺藤摸瓜法、打光巡线法、查询配置法等方法来准确获取一手资料。对于传输光缆的摸排,可能需要借助专用仪器如敲缆仪、光缆路由探测仪等。同时,为方便搬迁后设备重新连接,可以使用标签打印机在设备端口粘贴对端信息和单模多模等参数。

3.新拓扑规划

搬迁前,应根据新机房的机柜条件,详细规划搬迁后的拓扑结构和机柜内布局,包括绘制机柜内设备布局图,精确到机柜内具体位置,以便提高上架效率,有些因为时间跨度长导致的混乱布局,应当趁机优化,并合理安排机柜内设备的位置,可根据未来的替代和新增计划进行合理的机柜空间预留,如设置核心交换区、安全防护区、业务服务区、外部接入区等。

4.综合布线测试

在搬迁之前,需要对连接进行测试,以便在搬迁完成后能够快速恢复上下联用户的访问。为了控制网络割接时间,一般在新机房预留连接跳线并完成测试。在搬迁完成后,需要第一时间完成上下联用户接入。

5.数据备份

数据是无价的,确保数据万无一失是搬迁工作的重中之重。备份工作的方法取决于设备的类别和是否具备备份设备,并要求备份设备的配置、业务数据和系统状态得到可靠地保存。一旦发生硬件损坏或数据异常丢失等情况,备份数据可以有效帮助进行系统恢复,从而避免搬迁事故的发生。备份的可用手段包括容灾备份一体机备份、服务器数据库备份、虚拟机克隆文件备份等。针对机房搬迁中产生的大量数据,需要根据各业务系统的特点选择预估备份时间和方式。例如,交换机和网络设备配置较少,可提前进行备份;而用户活跃度较高的电子邮件系统,可依据系统功能在线备份某一时刻的数据,并在停服后追加增量备份。在保证数据安全的前提下,尽可能缩短割接时间,降低对用户的影响。对于老旧设备或易损坏设备,还需将备份文件复制至搬迁专用临时存储环境,以进一步保障数据安全。

由于业务系统复杂,涉及多个部门和运维人员,需要通知相关人员对负责的业务系统进行完整地处置,详细了解搬迁过程的注意事项,逐一进行记录。

6.软硬件健康检查

为了评估搬迁风险并提供相应的预案,需要对运行中的软硬件状态进行全面检查。可以通过多种方式进行检查,包括观察硬件设备的外观指示灯、通过远程桌面访问服务器、直联访问等方式来查看软硬件设备的运行状态。同时,通过虚拟平台目录访问等方式,可以查看部署在虚拟环境中的业务系统的CPU、内存和硬盘的工作状态,并分析系统日志。

在检查存储设备时,需要根据不同的存储设备操作要求进行操作。对于某些存储设备,需要使用专用软件登录以查看其健康状态。此步骤非常重要,要竭尽所能完成。而对于某些存储服务器,可能需要使用专用软件进行软关机,而其他存储设备则可以直接断电关机。因此,在操作过程中必须严格按照要求进行,以保护硬件的安全。

在进行软硬件健康检查时,如果发现任何问题,都需要逐一进行判断并采取适当的措施。特别是对那些具有重要影响的信息,需要在搬迁前先进行处置,以确保搬迁过程的顺利进行。

7.制定详细搬迁计划

一旦新机房具备搬迁条件,旧机房摸排翔实后明确风险应对预案,接下来需要制定详细的搬迁计划。首先是搬迁时间,根据服务中断时间评估情况,通常会选择晚上、周末、节假日等对用户影响小的时段。

其次是搬迁步骤。一般可按照以下顺序执行:停止网络服务——业务系统增量备份——关机测试——存储和服务器关机——网络设备(路由器、交换机等)关机——安全设备关机——设备下架(拔光纤线、网线、电源线并拆卸导轨)——打包、搬迁至新机房——安装导轨、上架设备——插光纤线、网线——插电源——安全设备开机——网络设备开机——存储和服务器开机——开启业务系统服务——系统功能测试及排故。

三、搬迁过程控制

(一)设备关机测试

通过开关机测试,预估系统停机时间,提前发现故障并解决。

(二)关机断电

为确保搬迁过程中的业务连续性,需要按照业务系统的要求进行关机分析,以了解各个应用系统之间的相互联系、逻辑依存关系、数据交换情况以及共用硬件设备的情况,从而确定合适的停机顺序和开机顺序。一般先服务器再存储再网络设备安全设备的顺序关机,虚拟机关机先关业务虚拟机,再关VMware vCenter Server(以VMware虚拟平台为例),最后关物理机。

(三)下架

设备下架前,可以先拆卸电源线,光纤线和网线可不拆。为了方便后续操作,可以用标签打印机标明对端端口的信息,以便在重新安裝时能够正确连接。此外,可以一起拆卸导轨,以便在新机房进行配套的上架操作。

(四)搬运

根据距离远近,采用人力搬运或物流搬运方式。注意轻拿轻放,避免磕碰震动。

(五)上架

以机柜为单位上架,先安装所有导轨,然后自上而下安装设备。

(六)连线、上电

以机柜为单位连接光纤线和网线。插电源线时,注意双电源的设备应将2根电源线插入不同的电源,以起到主备电源的作用。

(七)按顺序开机

按照关机相反的顺序依次开机,并检查设备加电开机的状态。虚拟机硬件开机后,直联或通过远程访问服务器按需输入密码开机,然后在更表中依次打开各虚拟机。

四、分系统恢复与运行

(一)业务系统检查和功能测试

测试网络是否联通,业务系统是否正常提供服务。通知用户协助测试,发现软硬件故障并维修。

(二)常见故障问题及处理方法

1.老旧设备无法开机

打开设备清理灰尘,并根据告警提示处理。以一台使用十余年的服务器为例,若线路恢复后,重新加电开机,服务器无法远程连接,服务也未开启,则判断为未正常启动。经观察对比同型号正常服务器,虽然指示灯能够点亮,但硬盘灯闪烁状态异常,直联显示器无画面。

此时可反复进行断电、静置、拆机处理。首先,使用除尘工具对主板、内存插槽等进行除尘操作,擦拭内存条的针脚后开机查看;若无法启动且无报警反应,可单独拆除硬盘后二次开机查看;若仍无报警,可单独拆除所有内存条后开机查看,若出现声音和闪灯报警,且面板灯提示问题插槽,可将内存条插入包括提示异常的插槽,此时服务器开机正常。

2.硬盘损坏

若存储服务器出现指示灯异常,且接入调试笔记本电脑,使用该型号专用工具软件查看报警信息提示该硬盘为热备状态且无法识别,则使用提前准备的备品硬盘替换可恢复正常。

3.业务系统无法访问

某防火墙设备无法访问,经排查,网线插错端口,未与搬迁前保持一致,调整后恢复正常。

4.业务系统异常,使用备份数据恢复

某业务系统开启后,登录时报用户名和密码不匹配的错误。经登录后台诊断,系用户数据库丢失。导入搬迁前备份的用户数据库以后恢复登录,但用户数据丢失,再导入用户数据资料,最终恢复正常。

5.切换光纤芯线

在广域网外部接入区域,如果光模块不亮,可以优先尝试交换两根光纤的位置,通常可以恢复正常。如果不能恢复,可以采用打光确定链路和光功率计测试衰减的方法排除光纤问题,进一步排查对端设备。

五、结束语

网络机房搬迁是一项复杂的工程,需要进行充分的调研工作,了解搬迁前的状态。在规划实施步骤时,应制定详细的计划,提前考虑可能出现的风险,制定相应的预案以应对。在进行搬迁时,应坚持原则,稳步推进,不慌不忙。避免出现错误和遗漏,确保搬迁过程的准确和顺利。否则,一旦出现问题,则需要花费更多的时间来排查故障,延误恢复进度。经过实践证明,只要统筹规划,制定合理预案,并有序组织实施,网络机房搬迁工作就能够成功完成。

参考文献

[1] 郭天明,郭小伟.省级金融机构中心机房搬迁实践及风险防范建议[J].中国金融电脑,2022.4:81-84.

[2] 马迅飞,张进铎等.高性能计算机系统搬迁与集成的规划与实施[J].计算机时代,2016(8):35-38.

[3] 林宇婷,任丽清等.卫星站机房改造及设备搬迁相关问题探讨[J].电脑知识与技术,2026.12(20):219-220.

[4] 侯鸣.信息通信机房网络搬迁问题的思考[J].电脑知识与技术,2012.8(26):6217-6218.

[5] 李新华.应用系统搬迁“不用愁”[J].网络安全和信息化,2017.4:82-83.

猜你喜欢
规划
“城中村”改造与规划的思考
“十四五”规划开门红
“十四五”规划建议解读
发挥人大在五年规划编制中的积极作用
规划计划
规划引领把握未来
快递业十三五规划发布
基于蚁群算法的3D打印批次规划
多管齐下落实规划
十三五规划