停止接收非电子档案:单套制数字档案馆

2020-10-21 08:21范志强赵屹
兰台世界 2020年2期
关键词:应用系统数字档案馆

范志强 赵屹

摘 要 2017年8月,美国国家档案馆宣布2022年底前将停止接收各联邦机构移交的非电子档案。未来的美国国家档案馆将演变为单套制数字档案馆。其数字档案馆核心系统ERA建设内容包括两个中心、三个实例、四大功能,2015年启动的ERA 2.0使用便捷方法开发三个主要模块。ERA提高了联邦政府文件处理与归档效率,改进了档案管理,简化了档案利用,提升了电子档案保存支持。ERA给予我们的启示是单套归档,档案馆将不再接收纸质档案等非电子档案,这是人类社会档案存史方式的重大改变。单套制的数字档案馆是一套复杂的系统,集成了多样化的档案管理功能与系统运行支持功能。系统必须不断升级、与时俱进。

关键词 数字档案馆 单套制 应用系统 敏捷方法 ERA

中图分类号 G270.7/G271 文献标识码 A 收稿日期 2019-09-28

★作者简介:范志强,大连市档案馆档案技术保护部副部长,档案学本科,研究方向为档案信息化;赵屹,国防大学政治学院教授,管理学博士,研究方向为档案信息化、档案法规标准。

Abstract In August 2017, the National Archives of the United States announced that it would stop receiving non-electronic records handed over by federal agencies by the end of 2022. The future US National Archives will evolve into a single-set digital archives. ERA, the core system of the single-set digital archives, consists of two centers, three examples and four functions. ERA 2.0 launched in 2015 uses agile methods to develop three main modules. ERA improves the processing and archiving efficiency of federal government documents, enhances archives management, simplifies archives utilization, and promotes the storage support of electronic archives. The enlightenment that ERA gives us is the single-set archives. The archives will no longer accept non-electronic records such as paper records, which is a major change in the way of keeping human social archives history. The single-set digital archives is a complex system that integrates a variety of archives management functions and system operation support functions. The system must be constantly upgraded and kept up to date.

Keyword digital archives; single-set system; application system; agile methods; ERA

2017年8月,美國国家档案馆宣布2022年底前将停止接收各联邦机构移交的非电子档案[1]。一石激起千层浪,这个极富“进取性”的档案管理战略引发广泛关注。事实上,该战略的实现离不开配套的技术与政策的实施,其中重要的实现措施就是ERA(Electronic Records Archives,电子档案馆)项目的建设。从本质上看,ERA就是一个完成电子档案归档和管理的单套制数字档案馆。

一、ERA项目的建设背景

美国国家档案馆与档案局(National Archives and Records Administration,简称NARA)在20世纪末发现他们面临电子档案管理的挑战。其挑战主要表现在以下三方面。一是归档电子文件数量急剧增长。美国国家档案馆自1970年接收第一批简易数据库和ASCⅡ码档案开始接收电子文件进馆,预计到2022年,进馆电子文件总量将达35万TB。二是电子档案种类繁多,格式复杂。不仅有传统档案的电子化形式文件,还有电子邮件、CAD图形文件、网页文件、计算机数据文件、数字式录音文件、数字式视频文件等。三是传统档案管理政策不能适用于电子档案管理。例如在一场涉及美国总统电子邮件删除案中,NARA作为被告之一被法院裁决为“允许了联邦机关对文件进行不适当的销毁。法官要求NARA要立即采取行动,……制订一个管理电子邮件的新准则”[2]。与之类似,众多电子档案管理准则的制订被提上议事日程。

在此背景下,NARA自1998年起,开始投入启动资金研究电子档案的保存与管理问题。2000年,ERA项目管理办公室成立。2002年,提出ERA系统需求。2005年,正式宣布由美国洛克希德·马丁公司承担ERA系统的开发。投资预算为3.08亿美元,预计开发时间为六年。2008年,ERA系统开始接收和存储来自白宫、国会和联邦政府机构的电子档案。2011年9月,ERA系统投入实际使用。2015年,NARA认为ERA系统“在可靠性、可扩展性、可用性和成本方面存在诸多问题”[3],于是启动ERA 2.0进行系统升级。ERA 2.0于2020年全面实施。

二、ERA项目的内容

ERA项目基于开放档案信息系统(Open Archival Information Systems,简称OAIS)的功能模型进行总体设计,其工作内容如图1[4]所示,可概括为两个中心、三个实例、四大功能。此外,ERA 2.0还要建设三个模块。

1.两个中心。ERA项目建设了“两个中心”,即数据中心(Data Center)和系统运营中心(Systems Operation Center)。数据中心主要实现图1中的存储。系统运营中心提供图1中的移交工作平台和利用工作平台。

2.三个实例。ERA项目部署了三个实例(Instance)。ERA目标是针对不同类型档案保存其流程与档案。为此,针对在不同规则下管理的各类档案,ERA通过单独的实例来实现某种类型档案的保存。ERA部署的三个实例分别是:联邦档案实例(Federal Records Instance,简称Base Instance),主要负责处理和保存从联邦政府机构获取的电子档案;总统行政办公室实例(Executive Office of the President Instance,简称EOP Instance),主要负责检索和访问从美国总统行政办公室获取的电子档案;国會档案实例(Congressional Records Instance,简称CRI Instance),主要负责保存从国会(包括众议院和参议院)获取的电子档案。由图1可见,三个实例分别对应联邦机构、总统、国会三类档案形成者。目前,对于捐赠的电子档案还没有相应实例进行接收和管理。

3.四大功能。ERA项目实现四大功能[5]。一是元数据功能。用于记录档案的历史价值、责任者、创建原因、处理过程。二是移交功能。政府机构使用该功能向ERA移交档案和元数据。该功能对应于图1移交工作平台的内容,包括读取数字介质、接收在线移交、验证移交、描述档案、转变档案格式。三是存储功能。实现档案的保存与复查。该功能对应于图1存储的内容,包括存储馆藏数据,存储电子档案初始格式并保持电子档案的持续存储。四是利用功能。社会公众使用该功能利用和访问非受控的档案信息。该功能对应于图1利用工作平台的内容,包括查找档案、呈现档案、生成特定版本、鉴定敏感内容、编纂敏感档案等。对于受控档案,有单独的、非公开的利用功能。

4.ERA 2.0的三个模块。在两个中心、三个实例、四大功能的基础上,ERA 2.0的愿景是使用敏捷方法(Agile Methods)开发三个主要模块(Modules)重构和增强已有的ERA系统。ERA 2.0的三个主要模块如下。

数字处理环境(Digital Processing Environment,简称DPE)模块。它更新了原有的工作流管理,是可扩展且灵活的环境,支持上传所有类型的数字资料,具有各种可扩展的用于验证和处理的软件工具,提供创建和编辑元数据的功能。NARA档案管理员可选择不同的软件工具处理各种数字档案,将处理过的数字档案包提交给DOR(参见下文)保存,并通过NARA的国家档案目录(National Archives Catalog,简称NAC)访问。

数字对象存储库(Digital Object Repository,简称DOR)模块。它是可扩展且安全的存储库,用于对ERA系统中存储的数字对象实现长期保存和访问。DOR支持从DPE获取处理过的数字档案,对其进行安全的档案存储,提供高级查找和发现功能,也可以向DPE提供数字档案以进一步处理。

业务对象管理(Business Object Management,简称BOM)模块。它是一个安全、灵活的应用程序,用于管理业务对象的保管期限表、移交、保管等主要流程[6]。

上述三个模块的功能通过集成多种微应用实现。三个模块相互独立,其中任何一个模块更新不会影响ERA的整体功能。由此,ERA具有可拓展性。

三、ERA项目实现的数字档案馆功能

1.提高了联邦政府文件处理与归档效率。ERA为联邦机构提供在线工具,用以创建新的档案保管期限表并将其提交给NARA。经NARA在线审核后,根据审核通过的保管期限表向NARA所辖档案馆移交永久的电子档案。ERA改进了向档案馆移交永久档案的过程和记录,填写移交目录、移交文据审核、电子档案移交均可通过BOM模块在线完成,由此提高了联邦政府机构文件处理与归档的效率。

2.改进了档案管理。ERA的档案管理功能允许处理权限、被该处理权限所涵盖的档案移交要求、实际移交档案之间自动链接。这意味着电子档案会根据来自档案保管期限表的一个预置移交信息,与一组丰富的、自动关联的起源元数据共同归档。由此,在数字环境下实现了档案根据保管期限表进行归档,实现了档案与元数据的关联,从而改进了档案管理。

3.简化了档案利用。目前,这部分功能主要体现在总统档案利用部分。总统行政办公室实例的档案管理组件支持对受限内容和受限编纂的审查功能。档案馆对通过审查的总统电子档案可以根据《信息自由法案》在达到开放条件时向公众发布。

4.提升了电子档案保存支持。ERA支持档案长期保存。档案馆当前政策是以移交时的格式保存档案。除此之外,也以迁移操作创建的新版本的格式保存档案。

ERA支持档案相关信息保存。ERA将一个标准的基本XML元数据目录与PREMIS(Preservation Metadata: Implementation Strategies,保存元数据:实施战略)保存元数据体系的元素结合在一起,用于保存元数据。

基于以上四项功能,ERA的目标是获取美国联邦政府机关、总统、国会产生的各种类型和格式的电子文件,将其以单套制形式作为电子档案永久保存,并为将来保存新类型档案做准备。克服时空障碍为具有合法利用权限的政府部门及社会公众提供利用,确保在软硬件过时的条件下仍可以对电子档案进行持续访问和验证。ERA 2.0最终将为电子档案提供端到端的生命周期覆盖。当前ERA已积累了500 TB的电子档案[7]。就其功能可以看出,ERA在数字环境下保存美国联邦机构的历史,就是一套单套制数字档案馆的应用系统。

四、ERA项目的启示

1.单套归档。单套归档是指ERA完全实现电子档案的归档而不必同时归档对应的纸质档案。而且,由于ERA的实施,美国国家档案馆2022年底前将停止接收纸质档案等非电子档案。这是档案管理的巨大变革,也意味着人类社会档案存史方式的重大改变。这一点向我们展示了数字档案馆未来的一种发展趋向。当前,我国电子文件归档实施“双套制”管理策略,即只要归档电子文件,必须同时归档对应纸质文件,其中纸质档案发挥凭证价值,电子文件发挥参考价值。双套制在从纸质时代向数字时代的过渡阶段有其积极的意义,它最大限度地保证了档案的凭证价值的留存。但ERA也让我们看到了数字时代档案工作未来发展的趋向之一。

技术给信息记录带来的根本性变化会不断改变档案工作。2016年11月17日,上海浦东新区召开上海自贸试验区电子文件归档和电子档案“单套制”管理复制推广会,上海自贸试验区在全国率先施行电子档案“单套制”。同年,国家档案局联合国家发展改革委遴选33家单位开展企业电子文件归档和电子档案管理试点工作,试行电子文件单套制归档管理。2018年12月,《电子公文归档管理暂行办法》进行修订,将第七条由“电子公文形成单位必须将具有永久和长期保存价值的电子公文,制成纸质公文与原电子公文的存储载体一同归档,并使两者建立互联”,修订为“符合国家有关规定要求的电子公文可以仅以电子形式归档。电子公文归档应当符合电子文件归档和电子档案管理的要求”,从法规上为单套制的施行提供了可能。由此可见,电子文件的单套归档是档案管理随时代发展的趋势之一。

2.系统复杂。系统复杂是指ERA提醒我们,单套制数字档案馆是一套复杂的系统。ERA最初设计是完成一个可以做所有事情的大系统。但进行到现在,ERA成为一个“系统之系统”,集众多系统于一体。如前所述,针对不同档案类型,ERA部署了联邦档案实例、总统行政办公室实例、国会档案实例三个实例,其收管的档案各自具有独特需求和专用存储格式。除此之外,利用不同的档案也需要使用不同的检索访问系统。例如,总统行政办公室实例中包括检索功能,可以查找和访问从美国总统行政办公室获取的电子档案。但要检索和访问联邦政府的档案,需要分别使用在线公共利用(Online Public Access,简称OPA)系统和涉密ERA(Classified ERA,简称CERA)系统分别检索开放和涉密档案。

ERA项目系统复杂的特点提示我们,在建设数字档案馆时,若要实施单套制管理,一定要将数字档案馆管理对象调研全面。在当前,档案管理还是传统文件档案处理方式的延续,不同的档案有可能需要不同的系统来管理。笔者认为,如果数字档案馆能通过一个系统解决所有问题,那表明其建设已经达到相当高的层次。

3.功能集成。因为ERA系统复杂,因此集成了多样化的档案管理功能与系统运行支持功能。ERA的初始设计具有超过1400项复杂的功能和监管要求[8]。然而,在2011年系统实施时,只实现了系统65%的功能[9],与前端系统对接、格式自动识别、数据迁移等功能未能完全落实。ERA最初的功能设想是单一系统解决方案,到ERA 2.0则改为模块化的微应用和工具组件。这些微应用与工具组件可以是内部开发的,也可以是商业化的或开源的。它们既相对独立、可复用,在技术快速变化、出现新的业务需求、处理新型檔案格式时又可被取代。微应用和工具组件还必须与NARA的其他工具和系统互操作,通过API(Application Programming Interface,应用程序接口)交换元数据和数据[10]。

由此,ERA通过前文所述的敏捷方法,结合微应用技术架构集成与整合多样化的功能,实现各种功能的模块化、组件化。其所有功能被分解为多个独立设计、开发、运行、升级的微应用和工具组件,它们之间通过API进行交互并实现集成。

ERA项目功能集成的模式给我们数字档案馆建设提供了一种新的思路。目前,我国的数字档案馆建设多数是单一系统解决方案,ERA的敏捷方法与微应用技术架构更快捷、更灵活,相对降低成本,而且具有更好的可扩展性。

4.与时俱进。与时俱进是指ERA的建设并没有一次性地“毕其功于一役”,而是不断地升级改造。2005年,当NARA宣布由洛克希德·马丁公司承担ERA系统的开发时,设想的就是花3.08亿美元、用六年的时间开发一个满足1400余项功能的系统。然而,到了2015年,NARA不得不启动ERA 2.0对系统进一步升级。ERA的花费也大大超出预算。在2011年系统实施时,花费已经飙升到4.33亿美元[11]。

ERA系统的升级并不是NARA主动作为的结果,而是因为电子文件单套制归档的复杂度远远超出预期,同时技术还在不断发展。NARA为了适应改变并满足新需求、利用新技术而被迫自我修正。ERA 2.0的与时俱进主要体现为更新功能、采用敏捷方法以及基于云架构。更新功能与采用敏捷方法前文均有所述,在此主要阐述基于云架构。

ERA 2.0基于云架构主要源于两点原因。一是外因。2010年云计算概念刚刚开始兴起,美国联邦政府就推出“云优先”战略。NARA及时响应并发布标准《云计算环境下档案管理指南》[12],开始将档案存储向云端迁移。二是内因。在线归档的便捷性导致档案馆接收电子档案的体量迅猛扩大,本地存储能力不断告急,云存储从经济性、灾备能力方面考虑是不错的选择。ERA 2.0的存储构想是对联邦机关已经存储在云中的电子文件直接在云端进行归档移交。

NARA启动ERA 2.0的关键驱动因素之一是认识到电子档案管理系统必须具备灵活性,从而在面对发展和变化时,具备足够的可变方法去支持对各种电子档案的管理和保存[13]。这启示我们,在数字档案馆建设过程中应用系统必须包含灵活简便的自动化处理,并包容未来可能的管理需求,具备良好的可拓展能力。

参考文献

[1]郭彩虹. 美国国家档案馆强势推进档案“无纸化工程”[EB/OL].[2019-09-16].https://www.zgdazxw.com.cn/news/2017-10/18content_207859.htm.

[2]傅华.美国电子文件管理的十年官司及启示[J].中国档案,2000(6).

[3][6]Office of Inspector General & National Archives. NARAs Electronic Records Archives 2.0 Project[EB/OL].[2019-09-10].https://www.archives.gov/files/oig/reports/audit-report-17-AUD-15.pdf.

[4]Thibodeau Kenneth. A Dynamic Solution for Electronic Records: The National Archives and Records Administration's Electronic Records Archives[EB/OL].[2019-09-16].http://ecommons.library.cornell.edu/bitstream/1813/3699/1/Ken_Thibodeau-NARA.pdf.

[5]NARA. ERA Status and Accomplishments[EB/OL].[2019-09-16]. https://www.archives.gov/era/about/status-accomplishments.html.

[7]NARA. About ERA[EB/OL].[2019-09-16].https://www.archives.gov/era/about.

[8][10][13]Leslie Johnston.ERA2.0: The National Archives New Framework for Electronic Records Preservation[J].Proceedings of the Association for Information Science and Technology,2017 (1):197.

[9][11]Anonymous. More Problems for NARA's ERA[J].Information Management,2011 (3):17.

[12]NARA標准.Guidance on Managing Records in Cloud Computing Environments [S].NARA bulletin 2010-05,2010.

猜你喜欢
应用系统数字档案馆
数字档案馆建设对档案管理体制的影响分析
浅议企业数字档案馆建设
企业计算机应用系统可靠性测试技术探讨
台湾数位典藏计划对内地数字档案发展的启示
VB应用技术下电教管理系统
高职学院信息化建设中面临的问题和思考
基于微信公众平台的应用系统开发模式研究
企业云平台建设研究
基于Enterprise Library的数字档案管理系统设计
郑州市网格化管理信息保障模式研究