四川测震台网中心机房空调稳定运行影响

2015-11-15 06:46
地震地磁观测与研究 2015年5期
关键词:测震台网机房

管 勇

(中国成都 610041四川省地震局)

四川测震台网中心机房空调稳定运行影响

管 勇

(中国成都 610041四川省地震局)

中心系统是四川测震台网运行核心,关系到台网速报、编目、维修、网络监控、信息报送以及数据服务等工作的正常开展。机房信息交换正常运转离不开恒温数据机房。IT硬件(对温度变化敏感)产生集中热负荷,严重时导致设备停机中断,造成台网中心系统瘫痪。中心机房必须安全稳定、可靠运行,在以往工作中,关注点往往集中在硬件和软件上,而忽视空调的重要性。

空调稳定运行;中心机房恒温;高温报警;巡检;系统连续运行

0 引言

中心网络系统是四川测震台网数据交换核心,关系到台网速报、编目、台站维护、信息报送以及数据服务等工作能否正常开展。广西气象局计算机中心机房集中安放了IT硬件网络设备,中心机房环境温度一直处于偏高状态,陈设广通过对影响广西气象局计算机中心机房环境温度的因素的分析,提出解决环境温度过高的具体办法(陈设广,2007)。手机短信在无人值守地震监测点防盗报警中的应用(王冬胜等,2009),在实际监测中取得显著的效果,较好节省了人力物力资源。数字地震仪防潮技术的实验研究有效解决数字地震仪器连续稳定的运行(张永刚等,2006)。

中心机房承担子台站波形数据汇集、分发工作,是测震台网系统的重要环节。数据信息交换离不开连续稳定运行的IT硬件集成设备。IT硬件(对温度变化敏感)运行会产生集中热负荷。IT硬件要求安装在密闭机房,在恒温状态运行,对空调的稳定连续运行要求较高。温度波动会产生许多问题,如处理时出现乱码。温度过高时,甚至导致系统中断,造成测震台网系统瘫痪,使地震监测和地震应急工作陷入被动。中心机房必须安全稳定、可靠运行,才能保障测震台网系统工作顺利开展。在以往工作中,关注点集中在软硬件上,忽视了空调的重要性,空调可以提供恒温环境,可以保障计算机系统稳定运行,本文就如何确保中心核心机房四季空调正常运行进行探讨。.

1 四川测震台网中心系统组成

四川测震台网中心技术系统主要由思科4507R交换机为核心的台网网络系统、华赛高性能SAN存储系统、13台IBM系列高性能服务器、摩卡综合业务管理系统组成。全网各台站数据接入通过一台思科7304核心路由器实现,整合CDMA VPDN、DDN、SDH等线路的数据接入。采用JOPENS系统流服务完成台站实时波形汇集和分发。JOPENS-MSDP承担本台网速报、编目任务、运行日志和参数报送,RTP系统辅助运行。四川测震台网中心技术系统示意图见图1。

图1 四川测震台网中心技术系统Fig.1 The schematic diagram of the central technical system of Sichuan Seismic Network

2 中心机房特点

2.1 显热量大

机房内安装的主机及外设、服务器、交换机、光端机等计算机设备,均会以传热、对流、辐射的方式向机房内散发热量,造成机房温度升高,属于显热。一个服务器机柜每小时散热量几千瓦到十几千瓦,装机密度较高的数据中心可达600 W/m2以上。机房内显热比可高达95%。设备热量通过传导、辐射方式传递到机房,设备密集区域发热量集中,为使机房内各区域温湿度均衡,且控制在允许的基数及波动范围内,需要较大风量带走余热量。

2.2 常年制冷

机房内设备发热属于稳态热源,全年不间断运行,需要一套不间断运行的空调保障系统。空调设备电源供给要求较高,不仅需要双路市电互设,而且对于保障重要计算机设备的空调系统,应配备发电机组做后备电源。因长期稳态热源存在,四川测震台网机房即使冬季也需制冷,只是电源消耗相对较少。

2.3 洁净度要求高

电子计算机机房有严格的空气洁净度要求。空气中的尘埃、腐蚀性气体等会严重损坏电子元器件寿命,引起接触不良和短路等,机房专用空调必须按相关标准对流通空气进行除尘、过滤。

2.4 温度范围合理

保持恒温对于数据机房的平稳运行至关重要,温度的快速波动也会对硬件运行产生负面影响,设计温度范围为19℃—22℃。

3 机房高温原因及超高温危害

3.1 高温原因

导致机房高温的原因有:①网络服务器机柜发热密度过高,散热不良,造成局部过热;②机房空调制冷量不够;③空调等制冷设备异常故障停机;④空调在市电断电后不能自启动停止工作,其他设备因不间断供电而正常运行,持续发热。

3.2 超高温危害

据统计,在基准温度情况下,温度每升高10℃计算机可靠性下降25%,造成:①磁盘磁带因热涨效应记录错误;②计算机时钟主频温度过高会降低;③系统停机,造成测震台网瘫痪;④机器损坏、数据丢失,甚至引起电源短路、火灾等事故。

四川测震台网中心机房经汶川8.0级地震后升级改造,日常系统维护仍多次出现空调故障,统计发现,空调停止运行15 min后,温度很快从20℃上升到25℃,30 min后上升到35℃左右,导致部分服务器死机,造成编目和速报系统瘫痪。实践表明,中心机房显热量巨大,且短时间内会造成相当大的危害。

4 保障措施

4.1 使用专用空调

计算机机房对温度、湿度及洁净度要求较严格,须使用专用空调。机房内显热量90%以上,包括设备自身发热,专用空调送风量大,使得换气次数多(通常每小时30—60次),能形成整体气流循环,设备冷却均衡。专用空调具有空气过滤器,能及时过滤空气中的尘挨,保持机房的洁净度。机房专用空调可大负荷常年连续运转,具备来电自启动(有线、或无线方式实现可选),空调故障可报警,可靠性高。

4.2 安装高温报警器

中心机房实行24小时值班,一般采用定时巡查方式,不够及时发现问题。统计发现,近几年多种原因导致空调停机数十次,致使机房温度快速升高,为此安装高温报警装置,可有效减小值班人员工作量。

报警器为硬件设备,安装简单,摆放在机柜或桌面即可,见图2。温度报警器带室温显示,温度自行设定,一般最高报警温度设置为25℃(空调常规温度设置为19℃)。报警方式如下:①电话报警:停电、超温、湿、烟,集拨打电话报警于一体,可以打4个电话;②声光报警:报警内容同上,实现声光报警,报警器可放置于值班室;③短信报警:报警内容同上,短信报警,可以给5个人发报警短信,可以短信查询机房状态,自动回复。

4.3 采用双机备用

采用空调双机备份/多机切换(定时、温控、主备切换),以便专用空调发生故障时,及时启动备用空调,确保空调连续运行,有效保持中心机房恒温环境,保障系统运行。

图2 中心机房高温报警器装置Fig.2 The high temperature alarm device at center room

5 空调故障及维护

空调构成主要包括压缩机、冷凝器、膨胀阀和蒸发器,还包括:风机、空气过滤器、加湿器、加热器、排水器等,因此,空调日常管理和维护,主要针对以上部件。中心机房系统维护人员需做到,能基本判断空调故障,小故障及时排除,复杂问题及时报修,以便空调短时间内恢复正常运行。

5.1 空调故障

(1)一般故障。室内机过滤网脏堵、皮带松、室外冷凝器积灰太多等,容易导致蒸发压力降低,冷凝压力升高,制冷量减少,机房温度偏高甚至超出控制范围,耗电量增加,影响工作效率及通信设备的正常运行。

(2)零部件故障。压缩机烧毁、冷凝器风机烧毁、电磁阀坏等零部件发生故障,导致机组制冷量减少,安全系数降低。

(3)机组运行性能差。制冷剂不足、系统内空气含量高、冷凝风机转速慢等,致使机组运行效率低,机组保护停机等,故障频频。

(4)人为故障。维护不当或操作不规范会引发故障:测试压力后阀门关闭不严;加制冷剂时加液管未进行排空气处理;打开进、排气截止阀时不用棘轮手,使截止阀顶针根部磨损,无法测试压力及添加制冷剂;加湿盘安装不规范造成溢水;三相相序错引起故障,等等。

5.2 空调维护巡检

(1)系统控制器检查。从空调系统显示屏检查各项功能及参数是否正常;检查报警记录,并分析报警原因;检查湿度传感器工作状态是否正常,夏天应加强对中心机房检查频度。

(2)压缩机巡回检查及维护。①听——听声音能较准确判断压缩机运转情况。因为压缩机正常运转时,响声应均匀而有节奏,否则表示出现故障;②摸——手摸可知发热程度,可大概判断是否超过规定压力、规定温度运行压缩机;③看——从视镜观察制冷剂液面,查看是否缺少制冷剂;④量——测量压缩机运行时吸、排气压力,可比较准确判断压缩机运行状况。

(3)冷凝器巡回检查及维护。①对专业空调冷凝器的维护相当于对空调室外机的维护,首先需要检查冷凝器固定情况,查看固定件是否松动,以免对冷媒管线及室外机造成损坏;②检查风扇运行:主要检查风扇的轴承、底座、电机等工作状况,在风扇运行时是否有异常震动;③检查调速开关是否正常,一般空调冷凝器有温度和压力两个调速开关,新控制技术采用双压力调速控制,检查调速开关时,主要查看规定压力范围内,调速开关能否正常控制风扇的启动和停止。

(4)蒸发器、膨胀阀巡回检查。检查蒸发器盘管是否清洁,是否存在结霜现象,蒸发器排水托盘排水是否畅通。

(5)定期检修合同签定。受专业知识限制,可与空调厂家签定定期检修合同,保障专用空调正常运行。

6 实施效果

对中心机房出现的故障分析发现,因空调故障导致温度升高,服务器运行中断时有发生。严格实施空调保障措施后,统计2009—2014年度四川测震台网中心系统设备运行率,发现系统运行稳定,运行率均在99.9%以上,见表1。可见,中心机房实施专用空调保障措施,确保了四川测震台网中心系统连续稳定的运行。

表1 四川测震台网2009—2014年度设备运行统计Table 1 Statistics of equipment operation of Sichuan Seismic Network from the year 2009 to 2014

7 结束语

笔者从事中心系统维护工作多年,深知空调正确维护是进行精确温度控制的关键。IT设备显热性导致中心机房产生高温,须安装专用空调,辅之高温报警器,定时人工巡检等,是确保空调不间断运行的重要措施。稳定运行的空调系统是测震台网连续运行的保障。

陈设广.广西气象局中心机房温度评估及解决方法[J].气象研究与应用,2007,4: 17.

王冬胜,胡德军,洪刚杨,等.手机短信在无人值守地震监测点防盗报警中的应用[J].四川地震,2009(3): 25-28.

张永刚,杨文东,杨亮.数字地震仪防潮技术的实验研究[J].地震地磁观测与研究,2006,27(4): 79-83.

The importance of stable operation of air conditioning for the center room of Sichuan Seismic Network

Guan Yong
(Earthquake Administration of Sichuan Province,Chengdu 610041,China)

The center system is the core operation of Sichuan Seismic Network,directly related to the network reporting,cataloging,repair,network monitoring,information reporting and data service work.The normal information operation of the engine room of data exchange cannot do without the constant temperature.IT hardware to produce concentrated heat load is not unusual,but also very sensitive to changes in temperature,serious equipment shutdown interrupted,causes the entire network system paralysis.The air condition is very important for the safety and reliable operation of the center room,but frequently paying the attention on focus on the hardware and software.

stable operation of air conditioning,room temperature,high temperature alarm,routing inspection,continuous operation of the system

10.3969/j.issn.1003-3246.2015.05.019

管勇(1972—),男,工程师,四川省地震局监测中心测震台网部工作,1994 年毕业于防灾技术高等专科学校应用地球物理专业。E-mail:1143200213@qq.com

本文收到日期:2015-05-08

猜你喜欢
测震台网机房
基于信号精度分析的高速铁路沿线测震井地震动力反应研究
钟祥台测震观测质量影响浅析
地球物理台网仪器维修信息管理的研究与实现
推进报台网深度融合 做强区级融媒体中心
测震波形数据存储和管理系统设计与实现
西藏地震应急流动台网浅析
N通信公司机房节能技改实践
辽宁省地震速报质量评比软件
某IDC机房结构设计
新型有线电视机房UPS系统的配置