天津气象观测记录档案数字化历程及成果应用

2020-06-21 15:28任建玲
兰台世界 2020年6期
关键词:档案数字化气象

任建玲

摘 要随着对气候变化研究的重视以及极端天气的增多,历史气象观测记录档案的需求与作用凸显。从20世纪70年代末至今,气象部门投入大量人力、物力和财力,历史气象观测记录档案的数字化取得了可喜成果。本文回顾了天津气象观测记录档案数字化的各个阶段、产生的数字化产品、档案数字化成果的应用,并对下一步工作进行了展望。

关键词气象 观测记录 档案数字化 成果应用

气象观测记录档案是在气象观测、探测中形成的,反映大气中各种气象要素、大气现象及其变化过程的真实记录,包括各种观探测记录表、簿、磁带(盘)、缩微胶片、光盘等[1]。气象观测记录档案是气象档案馆的馆藏主体,天津市气象档案馆收藏了大量纸质载体的气象记录档案,最早的记录档案始于1887年,是研究我国近代气候及环境的不可替代的宝贵财富,也是区域气候变化和全球变化研究的基础资料。这些气象记录档案主要以纸质载体为主,其信息无法得到更为广泛和深入的应用,数字化是解决利用和保护最佳的方法。

历史气象资料数字化是指将纸质历史气象资料扫描成数字图像,通过键盘录入方式将纸质或数字图像上的数据信息转换为可编辑、处理的数据文件,通过光学字符识别或波形图识别技术将数字图像上的数据信息转换为可编辑、处理的数据文件。对纸质历史气象资料进行数字化,既可以保护资料原件,维持其历史凭证价值,又能突破原有载体提供利用时的局限性,提高历史气象资料的应用效率[2]。

一、气象观测记录档案数字化历程

1.数字化初始阶段(1978—1990)。始于20世纪70年代末期,按照中央气象局的统一部署,天津气候资料室开始使用纸带穿孔方法对纸质地面气象观测记录月报表进行信息化,用手工打键的方法,把手工记载的气象资料变成电子计算机能接收识别的信息,记入纸带、卡片、磁带或胶片等信息载体上。参考依据就是1978年12月中央气象局业务处下发《全国地面气象资料信息化基本模式暂行规定》(中气业发字〔1978〕第212号文)[3]1,之后又对这部分记载地面气象观测信息的纸带资料进行了重新整理和录入,转换成了A0文件归档保存。A0文件作为重要的数字化气象资料,为之后的各项气象事业的发展提供了可靠的基础数据资源。

2.数字化持续阶段(1991—2008)。截至2008年之前,数字化工作持续进行。期间完成的主要工作有:(1)存贮介质转存。中国气象局预测减灾司气预函〔2006〕54号《关于做好2006年预测减灾业务服务专项能力建设工作的通知》下达了“天津市历史信息化气象资料存贮介质转存项目”。完成的主要任务是把2005年之前存档的各站地面、农业气象、辐射信息化资料,进行质量检查并分别存放在可读写CD-ROM光盘、磁带、在线服务器三种介质上。(2)降水自记纸迹线提取。降水自记纸是客观记录降水情况的珍贵气象观测资料,它记录着每次降雨的特征,包括每分钟的降雨强度、起止时间和各个时段的最大降水量,对我市开展降水特征和天气、气候的研究具有非常重要的意义,同时在防灾、减灾和国民经济建设中发挥重要的作用。

按照中国气象局气预函〔2002〕83号文件《关于在全国开展国家基本(准)站降水自记纸数字化处理的通知》的要求,2003—2007年期间陆续完成了“天津市降水自记纸数字化处理”项目。利用中国气象局气象档案馆和广东省气候中心共同研究开发的“降水自记纸彩色图形数字化处理系统”[4]737,依据中国气象局统一下发的《降水曲线数据文件数据格式》《降水自记数据(降水强度)标准文件格式》,完成了天津市所辖范围内两个国家基本站自建站2004年降水自记纸图像扫描、迹线跟踪处理、质量检查、数据转换、数据集制作等工作。成果包含4713个图像文件(*.jpg);4713个数据文件(*.zjr);2个分钟强度数据文件(R1文件);2个分钟标准数据文件(R01文件);2个小时标准数据文件(R60文件);2个图像数据集;1个降水曲线数据集;1个降水强度数据集。降水自记纸数字化是纸质档案数字化的一个大胆探索和实践,为其他纸质档案数字化提供了宝贵的经验和技术借鉴。(3)补录A6/V0文件。从2005年开始,开展国家科技基础性工作专项资金项目“气象科学数据共享中心”子项目“省级数据资源建设与共享服务”天津专题建设,通过对数字化历史资料的格式检查、质量检查、数据统计,完成了大量数据集制作,并大大提高了数字化历史资料(A0/A6)文件的质量。建立的数据集清单见表1。依托这个项目,天津按照《全国地面气象资料A6、A7文件信息基本模式暂行规定》(中国气象局预测减灾司文件,气预发字〔1999〕第14号)[3]29、气表-1封面、封底V文件格式(中气测发〔2001〕18号)[3]34的相关规定,对国家基本站自建站到2004年的地面气象记录月报表中逐时观测项目进行人工录入处理生成A6文件1500个、封底封面V0文件1500个,并通过合成软件合并为A文件。(4)风自记历史资料数字化。依托2008年开展的“天津市风能资源数据库建设”项目,按照国家级项目统一要求和本市风能资源评价的需要,通过手工录入和人机交互质量控制,完成全市四个参证站(塘沽、汉沽、大港、西青)建站至2008年12月的风向风速逐小时历史资料数字化工作,建立格式统一、数据完整和质量可靠的AF文件1968个,为我市风能资源数据库建设提供历史背景资料。

3.数字化飞速发展阶段(2009年至今)。2009年以来,天津市气象档案馆在中国气象局气象监测与灾害预警工程、气候变化应对决策支撑系统工程、山洪地质灾害防治气象保障工程项目专项经费的持续支持下,委托數字化外包公司先后完成天津市国家级气象台站各类地面观测记录月报表、新中国成立前各类历史气象观测资料、农业气象观测报表、高空气象观测记录表、气压、温度、湿度、降水、风向风速自记纸的图像扫描和数据集制作。完成情况与数据量见表2(见下页);数字化录入文件数据集见表3(见下页)。

2009年至2018年期间,取得了丰硕的数字化建设成果,这些成果已经在气象业务和科研中得到应用,取得了显著的成效。2019年的山洪地质灾害防治气象保障工程已安排经费,进行风自记纸迹线提取工作,目前正在进行中。

二、数字化成果应用

1.业务工作的支撑。历史档案数字化产品A系列文件,自20世纪70年代末诞生以来,一改数据人工抄录和统计的历史,在气象事业发展过程中长期发挥着重要的支撑作用,服务气象事业50年。数字化的档案满足了用户对不同时空、分辨率数据的需求,也为预报预测、气候监测、气候分析与评估、农业气象服务、人工影响天气、应急与减灾、气象灾害与防御等提供了重要的数据保障,促进气象业务发展,获得显著的社会效益。可以负责任地说,每项气象相关业务工作的开展都离不开历史数据的支撑,离不开档案的凭证和查考作用。

2.数据产品的基础。为了更好地提供数据服务,我们制作了大量数据产品,数字化的档案为各类数据集产品提供基础数据源,数据产品囊括地面、高空、辐射等各类观测,种类包括气候标准值产品、基础数据产品、气候整编产品、均一化产品、网格化产品等。

3.科研和服务的保证。数字化的档案为科学研究和气象服务提供必要的资料保证,支持气象科学研究项目462个,各级各类气象服务不计其数。科研项目的资助来源包括国家科技部、中国气象局、天津市科委、市发改委、市农委、市财政局、市技术监督局、市气象局等,还有一些横向合作的部门及高校。气象服务遍及全社会各个角落,关系到国计民生,小到气象灾害凭证、大到重大事项决策。举个最近的应用实例:2017年8月在天津召开的全国第十三届全运会,从筹备到开幕闭幕日期的选择,从综合气象条件分析到可能风险分析,从制定人工影响天气方案到应急方案制定,很多决策都参考了气象统计数据。我们提供的气象数据有近30年气候背景统计数据、4月到9月期间逐小时降水量数据、雷达基数据资料、历史天气图等数字化资料。科研方面,气候中心申请的天津市科技局项目“气候变化对天津市排水规划设计标准的影响评估”利用从降水自记纸提取的逐分钟降水资料,分析了气候变化对天津市排水设计的影响,分别利用年最大值法和年多值法进行了分区暴雨公式编制等。

4.服务基础资料专项。2011—2013年各省开展的“基础资料专项工作”,对地面、高空、辐射数字化资料存在的数据质量问题集中进行质量检查,使其完整性、可靠性和准确性进一步提升。在质量检查过程中,数字化档案起到了关键作用。利用最多的各类报表,使用的是扫描形成的图像文件数据集,完全不用人工从库房中提取原始纸质档案,节省了大量借阅、归还的工作,并保护了珍贵原始观测记录档案,工作效率提高70%。

三、数字化工作展望

1.新技术的应用提高效率。目前,气象资料数字化工作主要采用图像扫描技术、数据录入技术、图形提取技术等。其中,相对有难度、耗时较长的是自记纸类图形迹线跟踪技术,其过程主要是人机结合地对自记迹线进行跟踪,得到迹线特征点的坐标数据,从而得到给定时间段内逐分钟降水量数据,形成数据文件。相信未来会有更好的技术和手段来完成类似的工作,提高数字化效率。未来手写文本也能很准确地进行OCR识别,也会大大提高手写档案的数字化效率。

2.建立更高时间分辨率要素序列。自动气象观测站自2003年开始在全国范围内建立,自动观测仪器可以采集到各种观测要素的分钟数据,而在此之前,我们仅能提供一天四次的定时观测数据。随着对暴雨洪涝灾害、城市沥涝、多年一遇极端降水事件分析等的深入研究,对更高时间分辨率降水资料的需求越来越突出。在需求的引领下,我们开展了降水自记迹线提取工作,得到自动站建立前的分钟降水量数据,满足了科研的需要。风的数据对风能资源开发、桥梁设计、高层建筑设计、大气污染物扩散研究等起着至关重要的作用,因此长序列高时间分辨率风向风速观测资料是2019年气象科技档案数字化的重点工作。以需求为引领,是数字化工作开展的依据。进一步加强气温、气压、相对湿度等要素的数字化力度,取得高时间分辨率气象观测数据,是今后继续努力的目标。

3.提升历史气象资料数字化产品在线管理和服务能力。有了大量数字化产品,它的开发利用迫在眉睫。从档案安全角度着想,我们自主研发了“历史气象观测档案数字化检索平台”。该系统在服务器虚拟化平台上部署桌面虚拟化系统,在阅览室部署瘦客户机,完成历史气象观测档案数字化检索平台应用的桌面虚拟化实现。用户可根据档案分类和查询习惯,实现在平台上对历史气象观测档案的分类检索和调阅,提高了历史档案的检索效率。同时,系统的应用减少了对纸质档案的翻阅,从而保护了档案,降低了管理员工作强度,减少由于档案移动引起的工作失误;采用桌面虚拟化技术,实现了气象档案的安全访问,防止了档案未经授权的访问事件发生。

“十三五”氣象信息系统发展规划现代化目标明确提出,要提高数字化气象档案在线管理服务率,更便捷、高效、全面地提供长年代气候背景数据产品。这也是我们近年来的工作目标,在中国气象信息中心的领导下,逐步实现气候资料数字化图像在线查询、检索服务。

猜你喜欢
档案数字化气象
气象树
新乡市科协开展“世界气象日”科普进校园活动
文章有象
搭建档案管理数字化建设平台 实现国土资源信息现代化
档案数字化管理优势与弊端
档案数字化加工业务外包的风险及防范措施
档案数字化管理建设中存在的问题及对策
高校档案管理嵌入数模整合系统研究
气象医学与人体健康