提高数据中心机房管理效能研究

2021-01-15 08:14姜林红
安家(建筑与工程) 2021年49期
关键词:管理效能数据提高

姜林红

摘要:随着信息技术及其应用的不断发展,数据中心的规模越来越大,数据机房内的模块数量从几个增加到数十个,设备数量从上百台增加至上万台。数据机房作为信息化核心,其运维管理问题越来越得到重视。为加强数据中心的运维管理工作,确保数据中心安全、可靠、持续和高效运行,为业务系统稳定运行和信息资源综合利用提供坚实的基础支持,研究如何完善运维流程,提高管理效率有效保障设备稳定运行,最终实现数据中心机房运营维护的智能化将是必然发展趋势。

关键词:提高;数据;中心机房;管理效能

引言

在大数据时代背景下,信息化技术在各行各业取得了广泛的应用。机房作为信息化建设、运行的核心,在信息系统中扮演着举足轻重的角色,任何信息化网络设备都需要以机房基础设施作为支撑。为了确保机房安全运行,需要切实加强对机房运维的重视和投入,定期开展维修、监控工作。抓住大数据时代的契机,充分考虑大数据时代需求,构建机房综合运维管理体系,发挥信息化系统的效能,提供集扩展性和集成性为一体的全面采集、及时处理服务。通过整合运维服务资源,进而提升信息系统的运行效率,促进科技系统自动化和智能化高效运转。

一、数据中心的概念

数据中心是指为集中放置的电子信息设备提供运行环境的建筑场所,可以是一栋或几栋建筑物,也可以是一栋建筑的一部分,包括主机房、辅助区、支持区和行政管理区。其中主机房主要用于数据处理设备安装和运行的建筑空间,包括服务器机房、网络机房、存储机房等功能区域。数据机房内的各类设备应根据工艺设计进行布置,应满足系统运行、运行管理、人员操作和安全、设备和物料运输、安装和维护等要求。从智能化系统设计方面来讲,数据中心一般包括:环境和设备监控系统、网络和布线系统、视频安防监控系统、KVM系统、资产管理系统、数据中心气流和热场管理系统等。数据中心作为各种信息载体,发挥着越来越重要的作用,安全运行变得尤为关键。但是运维管理工作也变得越来越复杂,难度不断加大。

二、数据中心机房的主要职能

现阶段的经济社会发展领域,数字化和智慧化发展趋向越来越明显,而在这一发展趋势下,数据中心机房相当于中枢神经系统的作用,数据中心机房可以给网络系统提供各种的服务,辅助各个系统的可靠运转。数据中心机房的主要职能为:(1)数据存储和管理,这一功能的存在提高了数据信息的安全性,由于在数据中心机房内存在安全设计,有效避免了一些重要数据的丢失和泄露。(2)维持系统的可靠性与稳定性,专有数据中心机房建成以后,可以给用户提供各方面的服务,因为数据中心机房兼具多种功能,高标准的设计使得各个系统的运行更为稳定,网络服务更为高效。(3)安全防护与监督,数据中心机房建成并投入使用以后,其安全系数相对较高,可以在一定程度上对黑客和病毒入侵起到一定的抵御作用,多种安全技术的相互配合,为用户提供了良好的数据网络环境,构建了相对科学的安全防范体系。

三、数据机房运维管理内容

数据中心机房能否发挥其最佳性能与综合信息系统和基础设施是否完备息息相关。设定科学的机房运维管理内容,依托智慧机房的应用与运维管理模式,有效融入大数据时代所赋予的机遇,才能提供更加适宜的工作环境。首先,应设计出与单位实际相吻合的运行维护管理制度,按照相关法律法规,结合自身实际情况,制定行之有效的运维标准,打造全生命周期管理规范,利用奖惩措施保障机房安全运行管理制度的稳定落实。其次,打造具有战斗力的运维管理队伍,从实践的角度出发,发布运维流程、内容和标准,助力运维技术人员精准快速地解决问题。再次,依靠有效的电子运维工具实施定制化应用部署,针对虚拟化云平台的资源,开展远程自动巡检、动态管理,发挥大数据人工智能巡检应有的性能,助力3D视图下的按需分配管理。最后,机房运维管理内容需要搭建统一门户,全面采集机房内的各项监控数据,将采集、监控、展示一体化,构建自动化和智能化的维护工作,以期持续提高效率。

四、提高数据中心机房管理效能的关键策略

4.1加强计算机维护与更新

不管是硬件设备还是软件安装更新,都对学生的学习产生着重要的影响,计算机机房的管理人员要加强计算机的维护与更新,一般要遵循以下四种要求:(1)更正性。对计算机进行系统检测往往不可能纠正出所有的错误,这些问题在使用的时候可能会慢慢地被发现出来,因此,在使用的过程中如果出现错误要及时进行更正。(2)适应性。计算机的软硬件设备都是随着时间的推移而不断更新的,机房管理人员应该结合当下的信息系统及时进行更新,以适应新的信息环境,从而能够保证学生的正常学习。(3)完善性。这主要是对于电脑里的一些软件而言的,随着学习的逐渐多元化,很多学生会用到各种各样的学习软件,而計算机原本携带的软件不能够满足学生的学习需求,因此计算机机房管理人员及应该不断完善软件的更新和安装。(4)预防性。计算机在使用的过程中会出现众多的问题,但是这些问题不能等着被动发现,而要管理人员主动去检测并采取有效的措施进行预防,从而能大大减少计算机出现故障的频率,另一方面也能延长计算机的使用寿命。

4.2运维记录管理

运维人员对每台设备的运维操作有:上架和下架操作、定期常规运维(日检、周检、季检、年检)、突发性故障处理、更换备件等。按要求每次运维必须留存详尽的维护日志和检修记录。传统的运维记录只限于固定格式记录表和报告的填写,记录的数据类型为结构化数据。而更规范、更完善的运维记录还需留存照片、视频等非结构化数据。改变以往的传统模式,在资产管理系统中给每个设备增加运维记录,将运维记录与资产状态关联,根据某个设备故障等级和故障运维次数生成该资产健康状态指标,利用长时间积累的数据来自动评估设备健康值和稳定度,为数据中心长期采购计划提供决策依据。

4.3创建智能机房管理系统

持续加强机房管理制度的构建,以HTML5技术作为基础,通过创建物联网前端传感器,打造中心智能机房管理系统,在确保机房能够实现能耗监测的基础上,还可以智能识别,实现高可靠、低功耗的操作规程。按照智能机房管理系统架构的基本内容,重点加强网络层、感知层、应用层的服务。首先,在互联网通信网络感知工作部署当中,要结合实现QOS服务匹配,保持长距离传输的同时,还可以进行实时化的处理、上传、执行,最大限度地应用网络资源传输数据。其次,基于MQTT协议利用传感器网络,设置门禁、报警等执行功能,实现轻量级数据传输,促进传感单元向运管维向一体化方向迈进。最后,开发并应用手机端APP,结合用户平台定制化的操作模式,对机房网络资源访问,让感知数据能够随时随地便接受定制化的服务,便于技术人员对机房的实时化管理。此外针对机房的各种网络设备,科学使用VPN技术,及时优化防毒技术,不断更新设备档案,持续优化配置服务器,定期安装操作系统安全补丁。科学使用集群监管系统,通过创建临时专用逻辑网络,得到业务层计算数据。严格监控计算机机房,调整各个协议的参数,有助于调整设备的运行和技术参数,利用数据加密方式实现对各个指标使用率的精准控制。

4.4维持湿度温度稳定

温湿度的急剧变化与频繁变化对机器设备运行的稳定性及其内部零配件的寿命长短都存在巨大影响。空气处于饱和状态及其所含水蒸气的含量已达上限,称之为饱和状态,其所导致的环境变化不亚于“回南天”的道理,这时水分的累积显然会对机器造成严重破坏。以一般标准来相比,广义上相对湿度达80%以上被定义为潮湿,即众所周知的“回南天”。而多数情况下,相对湿度在65%及其以上时,物体体表会因环境水蒸气含量超标导致水膜形成,其所导致机器遭受的损坏不亚于将机器浸泡于水中。随着空气中水蒸气含量的上升,其越发接近饱和态,水膜所覆盖的面积亦随之增长。同时温度的增长促进了水分子进入机器内部空隙的可能,因而对机械设备造成的破坏与影响越大。除此之外,水膜的厚重化与面积的增长幅度,亦在一定程度上提高了机械设备短路发生的可能。因此,为了保持机房外部环境的稳定与合理,必要的措施采取已是迫在眉睫,亦是解決外部环境因素干扰的优良举措。例如,除湿机的使用便是保障机房温度与湿度稳定的最佳措施之一。一个小小的除湿机,就可帮助机房免遭温湿度的破坏性影响,又有何理由不额外增加措施去维持机房内部温度与湿度的温度呢.

4.5消防安全管理的措施

对于相关消防安全问题采取科学化、合理化的管控。(1)监控值班。要实现对消防安全集中式的监管,针对各级监管部门落实工作责任机制,设置消防主控室管理火灾报警系统以及相应的消防装备。同时对应的消防主控室还应当配备基本的设备,例如防火服、防爆服以及强光手电筒、对讲机等,并且将相应设备交由专业的人员进行管理和维护。(2)设备维护。针对设备维护板块,相关管理部门应当积极地制定设备保养维护机制。当发现设备出现故障时,需要对其进行快速修复和管控,以此来确保消防设备能够满足基本的使用要求。(3)处置扑救。具体来说,该模块主要是制定针对机房灭火,以及对相关应急事故处理措施的分析。结合对应的组织架构、报警系统以及紧急处置、应急疏散等相应的工作流程,减少火灾对于生命财产的损害,同时,针对应急扑救板块,对应的消防安全管理部门还需要开展及时的演练工作,对于各项演练程序进行明确,落实对火情现场临危不乱的人员管理模式,并且及时了解火情的综合状况,配合消防安全管理部门开展灭火工作.

结束语:信息时代到来以后,数据中心机房的建设项目日渐增多, 未来的不断发展中,各个数据中心机房都应该从全过程管理 出发,对机房中的各个要素开展全方位管理,充分提高数据 中心机房的运行稳定性和可靠性。

参考文献

[1]刘昀岢,张波.大数据背景下机房综合管理系统研究与设计[J].电脑编程技巧与维护,2020(09):78-80.

[2]薛兆军.计算机机房管理信息系统分析[J].集成电路应用,2020,37(09):152-153.

[3]李群.分析网络环境下计算机机房的管理与维护[J].数字通信世界,2020(09):115-116.

[4]赵伟.浅析机房管理中计算机网络技术的应用[J].信息记录材料,2020,21(09):192-193.

[5]涂祥宇,熊慧亮.浅谈数据中心设备及机房的智能化运维管理[J].中国新通信,2020,22(16):70.

[6]董傲通,文俊浩.基于“互联网+”的实验室机房智能管理系统设计与实现[J].实验技术与管理,2020,37(08):250-252+257.

[7]石晶.IDC机房IT支撑平台软件运维管理子系统[J].网络安全技术与应用,2020(08):110-112.

[8]马春龙.加强计算机机房的安全管理[J].决策探索(中),2020(07):83-84.

[9]翟书敬.探索计算机网络机房的管理与维护[J].数字通信世界,2020(07):272-273.

[10]古丽色曼尔·艾尼瓦尔.浅谈办公局域网中心控制机房设备管理与维护[J].电脑知识与技术,2020,16(17):54-55.

猜你喜欢
管理效能数据提高
开展民主管理提升班主任管理效能研究
小学班主任的管理策略研究
一种借助数据处理构建的智能食堂管理系统
提高幼儿教育质量的策略研究
数据化艺术的生成探究
让作文互评提高能力
漫谈初中作文教学
浅谈计量自动化系统实现预购电管理应用
区域“星级实验室”专项评估的实践与思考
企业人力资源管理风险与防范研究