大数据时代区块链技术在高校电子档案管理中的创新研究*

2021-01-16 13:20刘秀菊
菏泽学院学报 2021年3期
关键词:档案馆区块节点

刘秀菊

(菏泽学院人事处,山东 菏泽 274015)

高校档案是高校在人才培养、科学研究、基础建设、招生教学等活动中直接形成的对学校、师生、社会等具有保存价值的各种历史记录。高校档案作为国家档案资源的重要组成部分,也是高等教育科学发展的重要基础,具有非常重要的数据价值[1]。新时代我国各大高等院校不断朝着创新型、科技型与复合型的方向快速发展,在教学管理、学生档案管理、人事档案管理、财务管理等工作中不断有海量的电子文档生成,对档案管理的要求越来越高。但是我国高校现有的电子档案管理系统和方法难以适应当前知识经济发展的需要,因此提升高校电子档案管理规范化水平、推进档案管理向科学化方向发展势在必行。

一、高校电子档案管理中存在的问题

(一)高校电子档案真实性管理难以保证问题

目前,我国大部分高校电子档案管理工作没能实现统一规范管理,而且缺少专业的档案管理人员,管理方式不规范,电子档案使用率不高而形成信息孤岛,这给高校内部的档案信息实现科学管理、信息共享造成不利影响。档案管理,本质上就是对产生的档案、信息、资料进行整理与保管的过程[2]。虽然我国档案局已经通过《电子文件归档与电子档案管理办法》,对电子档案的管理制度进行了明确规定,但没有制定关于高校电子档案管理的相应标准,大都是管理人员靠着自己的经验工作,导致经常会出现电子档案信息的遗漏、错误或丢失。同时电子档案受到档案管理平台环境的影响,必须符合固定格式管理的要求,一旦所依赖的档案管理平台环境发生重大变化,电子档案必须适应信息技术带来的变化。如果现有的电子档案不兼容,极容易造成内容出现乱码、失真甚至信息丢失等极端现象。因此如何保障电子档案文件的安全和真实性问题是档案信息化管理的一大难题。

(二)高校电子档案管理中存在可信性降低的问题

首先,高校电子档案真实性管理不像纸质档案那么容易识别,也无法像纸质档案一样容易辨别判定,同时电子存储设备具有可重复读写特性,使其容易被篡改、伪造或者删除,而且电子档案无法像传统纸质档案一样显示原来档案信息痕迹。其次,电子档案形成或毁坏过程记录很难保存,也没有办法进行过程控制,即没有办法进行追踪溯源。此外,存储重要信息的高校电子档案,管理数据量大,其自身存在着易被修改和网络环境复杂等问题,容易遭到黑客、计算机病毒、外部磁场等因素干扰,导致电子档案信息被破坏或丢失。以上情况都会给档案资料带来无法恢复的严重后果,从而降低了电子档案数据的可信性。

(三)高校电子档案数据信息存在存储安全隐患问题

传统档案馆的安全管理只需要档案管理人员严格执行档案管理规定进行规范管理,如按照档案室环境要求,保管好纸质档案资料完好无损等。现在是大数据时代,各高校档案馆一般通过档案扫描、图像处理、图像存储、档案整理、目录建库、数据挂接等步骤把纸质档案转换成各种形式的电子档案,电子档案的存储和传输都是在网络上进行的,一些计算机黑客和不法分子会利用系统安全漏洞入侵档案管理系统,非法获取、篡改电子档案资源和其他数据信息,给档案数据库带来重大损失。而且,各高校档案馆一般把电子档案的全部数据集中在一台或多台设备上存储,通过电子档案管理平台软件进行管理,这种集中式存储管理虽然给信息的储存带来方便,但由于没有其他部门对档案信息进行多份备份存储,当受到网络攻击或人为失误导致存储设备损坏时,将造成被篡改或丢失后档案数据无法挽回的后果[3]。

(四)高校电子档案存在收集和共享利用困难问题

高校档案信息属于高校资产,随着我国高校对信息化需求的不断扩大,在各部门工作中不断产生海量的电子文档,除了档案馆等主要的信息化档案管理部门之外,还存在各部门和各院系等二级单位参与收集和使用档案信息的情况。如果高校档案管理信息化建设缺乏统一规划和有效沟通,将导致高校档案电子化管理难度加大,主要表现为:一是档案资源收集困难,难以进行有效的管理和协作,有时还会出现各单位互相掣肘的问题;二是档案信息资源共享困难,每当有关单位或个人需要调阅或检索档案时,往往需要耗费大量的人力与精力,导致档案不能得到合理的利用,从而大大降低了工作效率,使宝贵的档案资源无法为高校的经营决策提供良好的支持和服务,严重影响了高校档案管理信息化建设的整体发展[4]。

二、高校电子档案管理引入区块链技术的可行性

(一)区块链技术

在信息化、数字化发展到一定程度后,区块链技术是一种反逻辑与反常识相结合的技术结构,是一个信息技术领域的术语。区块链技术起源于化名为“中本聪”(Satoshi Nakamoto)的学者在2008年发表的奠基性论文《比特币:一种点对点电子现金系统》[5];2016年12月,《“十三五”国家信息化规划》将区块链列入国家信息化规划,并将其定为战略性前沿技术,标志着我国开始推动区块链技术和应用发展[6]。区块链技术本质上是一个共享数据库,是计算机技术的一种新的应用模式,如共识机制、加密算法、点对点传输、分布式数据存储等[7],存储在其中的数据或信息具有“不可伪造性”“全程跟踪性”“可追溯性”“公开透明性”“集体维护性”等特征,为“信任”奠定了坚实的基础,可与多个行业融合,具有比较广阔的应用前景[8]。

(二)区块链技术在档案管理中的应用现状

大数据时代,区块链新技术的出现,为解决电子档案管理难题带来了新的突破。国外的相关研究较我国起步早,2017年加拿大Victoria Lemieux[9]、美国数字档案工作者Cassie Findlay[10]发表多篇关于区块链技术应用于文件档案管理研究的论文。将区块链技术应用于电子档案管理中在国外已有实践案例,如澳大利亚墨尔本大学在学生记录档案管理中开始应用区块链技术[11]。但英国哥伦比亚大学Hofman教授曾提出,如果真正实现利用区块链解决档案问题,还需要从社会、数据和技术三个层面加以分析,区块链在档案管理中的应用处于起步阶段,还有众多问题亟待探索和解决[12]。近两年国内档案界主要对区块链与电子档案结合是否可行[13]、区块链技术在电子档案信任共享管理应用以及区块链技术在档案真实性信任安全方面探究较多[14],关于区块链技术在电子档案管理应用的成功案例几乎没有。总之,目前国内外关于区块链技术在电子档案管理方面的研究和应用还处在初级阶段,特别是在高校电子档案中的应用及创新研究方面,涉及较少。本文通过探究区块链技术与高校电子档案管理的融合点,提出创新方案,以期为我国高校电子档案的科学、高效管理提供可行的模式探索。

(三)区块链技术与高校电子档案管理的融合点

1.不可篡改特性与高校电子档案信息真实性保障融合。区块链不可篡改的特性主要体现在以下两方面:一是区块链的哈希值。哈希值就是通过哈希算法把任意长度的输入字符串转换为密码并进行固定输出的过程。如果把档案摘要信息存储在区块链上,链上的各个区块都相连,每个区块都存着前一区块的哈希值,当链上的任意一个区块结点被改变,就会导致前后区块状态发生变化。该特性保证了链上数据没法被恶意篡改,应用于档案信息管理平台可以记录电子档案管理中的全部变化,防止档案信息被恶意篡改。二是区块链共识机制,它主要解决系统各单位之间如何对记录的有效性达成共识,目前区块链共识机制主要有工作量证明、权益证明、股份授权证明。以比特币为例,采用的是工作量证明,根据分析,只有控制全网超过一半以上的链上记录节点,才有伪造出一条不存在的记录节点的可能,从而防止了数据被篡改的可能,如将此功能应用于高校电子档案管理中,将有效保证档案数据的真实性[15]。

2.追溯性和可验证性与档案证据信息的可信认证保障融合。区块链技术中的时间戳可以自动在档案数据上形成唯一准确的时间戳,并将相关档案数据信息存储到同一时间链中,为档案数据的整理、分析和汇总提供有效的分类[16]。同时,还保证了档案数据的可追溯性,减少了人为因素造成的电子档案泄露数据和被篡改的风险。利用区块链技术中的数字签名技术来验证电子文件信息的完整性和真实性,其基本过程是管理者对需要被签名的原始数据进行散列,然后通过私钥对电子档案摘要信息进行加密,管理者只能根据自己的私钥构造签名信息,并将其与原始数据一起传送给使用者,使用者也只能用管理者的公钥解密加密的摘要,然后用相同的哈希函数为接收到的文本生成摘要,如果与解密的摘要信息相同,则表示接收到的信息是完整的,并且在发送处理中没有被修改,否则,意味着信息已经被修改。因此用数字签名方式可以验证信息的完整性,保证档案证据信息的可信认证。

3.分布式存储特性与高校电子档案的数据安全存储融合。分布式存储是一种将数据分布到多个网络节点的数据存储技术,节点之间通过加密协议进行通信,每个节点的物理分布不受空间和地域的限制,即在区块链系统中,每个运行的节点都有一个完整的数据拷贝,可以独立地检索数据,极大地提高了效率,增加了整个系统的可靠性,并且节点之间的数据可以同步[17]。高校电子档案可以采用区块链技术的分布式存储,当数据存储的任何一个区块受到网络攻击或出现硬件故障时,也不会造成灾难性的影响,因为具有相同备份的其他节点将继续发挥作用,而被攻击区块将被其他节点取代,又因为存储的数据不再集中到服务器上,黑客没有办法攻击,所以也就不会出现服务器崩溃而导致数据丢失和服务中断等问题。实现在分布式、去中心化和虚拟化的网络中进行加密存储,使档案数据更加安全可靠,充分保障了高校电子档案的安全数据存储。

4.智能合约技术与高校档案馆能源智能化管理融合。智能合约是一种已经转化为区块链软件语言并存储在区块链中的合约,合约事件出现时,就会自动启动并执行,实现区块链自治性。高校档案馆的能源智能化调控则主要解决电子档案管理中智能收集和档案信息资源共享自助的难题。当区块链技术的智能合约机制应用到收集电子档案过程时,满足合约,智能合约就会自动产生并且执行,其操作过程会被记录并且存储到区块链中,如果终端管理部门的要求不符合智能合约,系统将显示“申请被拒绝”,电子档案信息将不能被加入链中,从而发挥智能收集电子档案的功能。智能合约同时提升了档案数据的共享效能,当不同档案使用者申请读取电子档案数据时,区块链会判断每位使用者的申请,如果申请需求满足合约要求,那么会直接执行,按照使用者需求提供相应的档案数据信息,从而智能实现使用者的申请,简化流程,解决电子档案使用率不高而形成信息孤岛问题,实现档案信息资源共享,提高电子档案的利用率。

三、基于联盟链高校电子档案管理模式创新方案

档案界关于区块链应用模式主要分为:公有链模式、私有链模式和联盟链模式。其中联盟链模式具有多中心化节点连接、不是完全的去中心化,有访问权限设置的功能,能够使得整个生态系统的运行效率更高、成本更低,联盟内,每个节点都能够连接到这个链上上传或下载信息。目前联盟区块链与高校电子管理融合度最高,应基于联盟链构建高校电子档案管理模式创新方案,以解决高校电子档案管理中存在的问题。

(一)基于联盟链构建高校电子档案的管理模式主体

高校可以采用联盟链模式创建区块链高校电子档案管理平台。联盟链建立不是一个人或几个人能够完成的,需要专业供应商参与才能完成。高校档案馆负责协助建立区块链和节点的认证,保证入链节点可信性,并设置不同主体相应的权限;平台主体主要包括档案馆、人事处、教务处、科研处等部门和各二级学院区块,他们组成预授权节点群,属于多中心化节点连接、不是完全中心化,而是半去中心化联盟链模式,档案馆与各部门共同管理和使用区块链上的高校档案数据。

(二)基于联盟链构建高校档案馆的“中心”地位

在构建联盟链高校电子档案管理平台时,高校档案馆作为区块链节点之一,应区别于其他节点,因为它承担着对所有档案业务的管理职责,很多网上服务依然需要作为“中心节点”的档案馆来解决,它负责每个环节、每个部门的档案信息安全。同时在搭建区块链电子档案管理系统时,高校档案馆作为档案管理部门必须与其他单位进行有效的沟通,统一规划,充分考虑档案封装、存储、鉴定、授权和利用等各个方面的问题,促进各部门和各二级学院间达成共识,实现档案信息数据资源共享,降低运行维护成本[18]。

(三)基于联盟链构建“多中心”的强信任体系

虽然档案馆是高校档案管理的主要责任主体,但不是唯一的责任主体,其他部门和二级学院既是电子档案的提供者和使用者,又是保护“第一手”档案信息真实性和完整性的部门。在创建管理平台时,要设计各二级单位与档案馆的服务器节点都拥有相同的档案数据管理账簿,并且都能够参与区块链的生成、更新和存储。利用区块链分布式存储技术布署档案馆和其他各部门服务器结点,可以有效解决电子档案多套储存的技术难题,因为链上的每个节点部门都备份电子档案,从而实现了多套电子档案的备份,降低了单个节点部门遭攻击后被破坏的程度,能够保证高校电子档案的数据安全存储。在区块链中,各部门都作为中心结点形成“集体维护”的强大生态环境,在智能合约调控下实现档案管理平台的智能收集和档案信息资源共享自助功能,同时对区块链中保存的档案信息设置数字签名和时间戳保证档案证据信息的可信认证。高校各部门电子档案存储在联盟链中数据信息不仅安全,而且稳定性高,还可以彼此验证区块链节点的正确性,互相监督,从而使个人或单位确信从系统平台获得档案数据的真实性,把高校电子档案管理平台建成强信体系。

高校电子档案发展现状与大数据背景下区块链技术相结合,构建基于联盟链的高校电子档案管理模式创新方案,将有效解决目前高校电子档案管理中存在的问题,为区块链在高校电子档案管理中的实践探索提供启发与助益。

猜你喜欢
档案馆区块节点
Formation of advanced glycation end products in raw and subsequently boiled broiler muscle: biological variation and effects of postmortem ageing and storage
CM节点控制在船舶上的应用
云南省档案馆馆藏《东巴经》
区块链:一个改变未来的幽灵
概念格的一种并行构造算法
结合概率路由的机会网络自私节点检测算法
区块链:主要角色和衍生应用
《红楼梦》的数字化述评——兼及区块链的启示
云南省档案局办公室关于表彰2018年度《云南档案》优秀通联组及发行先进单位的通报
一场区块链引发的全民狂欢