理念、实践与风险:大数据时代国外档案数据治理研究述评

2024-04-25 05:04谭必勇
北京档案 2024年3期
关键词:大数据时代

谭必勇

摘要:论文从多维视角探讨国外档案数据治理研究的最新进展,旨在把握大数据时代国外档案数据治理的本质内涵与工具体系。首先,在理念上侧重于探讨大数据环境下文档概念和来源原则的适用性,阐释了档案数据治理的兴起及其表现;其次,注重从技术与战略的视角分析档案数据治理实践特征,尤其关注电子治理、IT治理、信息治理等不同话语下档案数据治理机制及其适用性;最后,在风险层面集中探讨了档案数据开放与服务活动的信任危机表征及解决策略,而社会大众数据保存热潮及催生的数据行动主义研究尤为引人瞩目。保持坚守与发展间的动态平衡,始终是国外学者开展档案数据治理理论与实践探索的基本准则。

关键词:大数据时代 档案数据治理 档案数据范式 档案数据管理 数据行动主义

Abstract: This article provides a multidimen? sional exploration of the latest development in foreign archival data governance research, with the aim of grasping the essential connotations and tool systems of foreign archival data gover? nance in the era of big data. Firstly, it focuses on the applicability of concept of records and ar? chives and the principle of provenance in the big data environment, elucidating the emergence and manifestation of archival data governance. Secondly, it emphasizes an analysis of the charac? teristics of archival data governance practices from technological and strategic perspectives, particularly focusing on the mechanisms and ap? plicability of archival data governance in various fields under different discourses such as electron? ic governance, IT governance, and information governance. Finally, it centrally discusses the trust crisis representation and resolution strate? gies of archival data openness and service activi? ties at the risk level, while the burgeoning re? search on data activism, propelled by the surge in public interest in data preservation, stands out significantly. The dynamic balance between ad? herence and development has always been the fundamental principle guiding foreign scholars in the exploration of theoretical and practical archi? val data governance.

Keywords: Big data era; Archival data gover? nance; Archives-as-data paradigm; Archival data management; Data activism

國外档案学界引入“数据”“治理”等术语已经有了较长的时间。“数据”理念早在20世纪60年代就开始被引入机读档案管理领域,提升档案部门的数据存储能力与处理效率[1]、创建社会科学数据档案机构[2]等活动的开展,使数据管理理念进入档案学者的视野。1993年,英国著名档案学者迈克尔·库克(Mi? chael Cook)出版了《信息管理与档案数据》一书[3],为档案界从信息资源管理视角开展理论研究与档案数据管理实践提供了重要指引。相对而言,“治理”一词则较晚被引介到档案学界。2002年,美国历史学家安·劳拉·施托勒(Ann Laura Stoler)撰文指出,档案中蕴藏着丰富的“治理艺术”。[4]两年之后,加拿大著名档案学者特里·库克(Terry Cook)从宏观鉴定的视角较早认识到从文件管理到文件治理的转型趋势,“治理”一词开始逐渐为档案学界所熟悉。[5]但是,这些研究成果主要局限于档案机构内部的档案数据资源处理等技术层面,难以在档案学科层面产生整体性的“质变”。

大数据时代,档案的数据价值潜力日渐受到重视,档案数据及其治理研究成为学界的热点话题。为把握国外档案数据治理前沿趋势,笔者于2023年8月20日通过Web of Science和EBSCO、Emerald、Project Muse、Proquest、Springer、Scopus和Tay? lor & Francis等西文数据库以及《美国档案工作者》(The American Archivist)、《档案》(Archivaria)等国际主流档案学期刊的官网等检索路径,以“Archival Data + governance”“Archives/Records + Data Governance”“Archives/Records + Digital Gover? nance”“Archives/Records + Big Data”等检索词进行主题和篇名检索,经过相关性和重复性比对等处理,共计得到相关论文142篇。通过梳理相关文献,笔者发现,国外在档案学的视阈内对“档案数据治理”问题的关注源自国际电子政务建设、大数据战略、“开放政府数据”与数字政府建设等重大政府信息化战略而引发的档案理论与实践界的震动,并伴随着各国档案机构对社交媒体策略和“数字连续性”战略的深入推进而逐步兴起,既有理论反思,又涉及技术实践及风险治理。

一、理念:大数据与档案数据治理的兴起

新一代信息技术的大规模应用造就了复杂的数据环境,传统数字文件的选择、保存与访问方法将面临大数据和大规模存档(large-scale archiving)的严峻挑战。著名档案学者、加拿大英属哥伦比亚大学的露西安娜·杜兰蒂(Luciana Duranti)等结合电子政务、开放政府数据等实践,主张将档案概念嵌入大数据环境中以更好地理解数据管理和数字保存。[6]美国学者夏兰·B.特雷斯(Ciaran B. Trace)主张档案学者要熟悉计算机硬件、应用软件和系统,了解计算机如何协同创建、管理和存储具有长期保存价值的数字对象,以更好地理解原生数字文件及其管理模式。[7]加拿大学者格雷格·巴克(Greg Bak)认为,机读档案时代回应桌面计算(desktop computing)而形成的主要思想、基本方法和核心原则在构建大数据时代档案理论和价值观方面依然具有重要参考价值。[8]档案多元论[9]、数字连续性(digital continuity)等学术思想和数字档案工作者(digital archivists)、数据档案工作者(data archivists)等职业概念的涌现,表明全新数据管理环境下档案学术话语体系亟待重建。[10]

大数据环境下电子政务、数字政府发展迅猛,业务管理系统数据、物联网数据资源、社交媒体文件、科学数据等数据类型复杂多样,催生大数据的文档化管理难题,因此文档概念、全宗理论、来源原则的可用性及在数据治理框架下的适用性是国外学者普遍关心的话题,从而试图重构数字时代的档案数据治理理论体系。英国学者迈克尔·莫斯(Michael Moss)认为将档案真实性、完整性等核心理念融入业务数据管理系统有助于防范数据风险,[11]而大数据时代档案将从“待读取的记录”转变为“待挖掘的数据”,这要求档案工作者积极转变工作理念,重构适应数字时代的理论体系。[12]瑞典学者安-索菲耶·克拉雷尔德(Ann-So? fie Klareld)和卡塔琳娜·L.伊德隆德(Katarina L. Gid? lund)指出文化和话语影响着我们对数字环境中的档案的理解,在纸质档案管理中形成的先入为主的观念、规范和做法影响并限制了我们对数字档案的认识,因此建议要摒弃传统的“纸质思维”(paper minds),将归档流程纳入电子政务的目标体系,以构建适应数字背景的数字档案治理模式。[13]加拿大信息管理专家艾米莉·拉尔森(Emily Larson)从档案理论视角考察了政府大数据的数字保存需求,她建议创建适当的元数据捕获大数据的身份、技术特征和管理行动,平衡技术和伦理等关键问题,以保存真正意义的大数据文件。[14]挪威学者托马斯·瑟德林(Thomas Sedring)等研究发现,通过文件管理原则来管理政府部门的物联网数据资源,比大数据和语义网等方法更具优势。[15]英国学者朱莉·麦克劳德(Julie McLeod)等认为,数字时代“记录”(record)的概念面临重构风险,需要档案工作者与其他合作者通力合作解决数字文件管理及其未来可用性(如证据价值等)的重大问题。[16]美国学者亚历克斯·H.普尔(Alex H. Poole)以科学数据保存工作为例,认为来源原则、档案鉴定、真实性、元数据、风险管理等核心档案原则在数据治理工作中依然发挥着关键作用。[17]这些理论成果聚焦數字政府环境下大数据的文档化管理理念、路径与风险等重大现实问题,有助于化解社会数字化转型中档案学的“失语”“失能”“失范”等学术困境。

由此看出,随着大数据时代的来临,拥有丰富历史数据的档案馆成为重要的数字信息基础设施,其在支撑国家治理、透明政府建设以及科学研究中的价值日益受到学者的关注,“档案数据范式”(archives-as-data paradigm)[18]作为一种新兴档案理论范式日益凸显,国外档案数据治理的理论研究逐步走向深入。

二、实践:技术与战略双重视角的档案数据治理

档案数据治理既是一个重大的理论创新,又是一个紧迫的现实难题。国外学者主要从技术应用和战略分析两个层面解读档案数据治理的现实进展及特征。

(一)档案数据管理的技术及优化策略

云存储、大数据环境下档案数据的可信保存与可持续性服务等技术问题是国外学者们重点关注的议题之一。从现有文献看,国外档案机构和学者对档案云存储、云服务普遍持积极、开放的态度,政府机构、企业和个人开始使用云设施而非自己的数字基础设施这一历史性变化将对档案馆产生深远影响。波兰学者安娜·索布查克(Anna Sobczak)通过介绍德国巴登-符腾堡州档案馆自主研发的数字存储软件,探讨了地方档案馆合作开发档案云存储服务平台的可能性。[19]瑞典学者埃里克·A.M.博里隆德(Erik A. M. Borglund)则从档案工作者视角对云信任解决方案的技术问题及解决方式进行了阐释。[20]南非学者阿莫斯·希巴姆布(Amos Shibambu)等构建了基于南非公共部门云平台的数字文件管理框架,提出了档案数据资源上“云”的路径与方法。[21]加拿大档案学者汤姆·内史密斯(Tom Nesmith)认为,以云存储为代表的支撑数字通信管理的新兴基础设施形态将是社会和档案馆所面临的全新数字环境的最重要、最持久的特征,档案部门需要在这一新的公共空间建构公有数字档案基础设施以满足未来社会的档案需求。[22]

除此之外,自然语言处理技术(NLP)、地理信息检索技术(GIS)、区块链技术在档案数据服务与数据信任方面的应用研究也广受关注。谢菲尔德大学和英国国家档案馆共同探索了将自然语言处理技术和地理信息检索技术引入历史档案数据服务领域的可行性。[23]加拿大学者格伦·丁沃尔(Glenn Dingwall)等探讨了利用数据网格技术将基础地理信息数据保存为长期可信文件的方法与策略。[24]区块链等新兴分布式信任技术打破了组织的信任和授权结构以及文件和数据的创建、管理与利用的传统规则,进而催生了组织、社会和数据转型,美国、加拿大的多位学者从信息治理视角出发,分析了区块链技术在文件管理和档案数据管理等方面的应用前景及相关优化措施。[25-27]

近年来,人工智能和机器学习在数字档案的价值鉴定、开放审核、开发利用、隐私控制等档案数据管理领域的巨大潜力日益受到学界重视。澳大利亚学者格雷戈里·罗兰(Gregory Rolan)等[28]、瑞典学者吉格斯·安根恩德(Gijs Aangenendt)[29]关注了人工智能对档案数据治理实践和档案职业的整体影响。德国汉堡大学的安格利卡·祖加纳图(Angeliki Tzougana? tou)[30]和英国学者利斯·吉里安特(Lise Jaillant)[31]等对人工智能、机器学习技术在数字档案的开放与隐私控制、敏感词审查等领域的应用情况及效果进行了讨论。英国学者詹妮·邦恩(Jenny Bunn)[32]、法国学者玛丽-安妮·沙班(Marie-Anne Chabin)[33]和加拿大学者杰里米·达维特(Jeremy Davet)等[34]分析了人工智能在文档数据服务、档案数据质量治理等领域的应用范围。美国北卡罗来纳大学的特迪·兰德比(Teddy Randby)等利用美国罗斯福总统图书馆的历史档案开展数字保存和机器学习实验,提出了“机器学习的历史语境”(historical contextualization of machine learning models)的概念,展示了歷史档案数据治理对于提升机器学习算法的意义。[35]

不难看出,学者们从实时数据和历史数据、开放审查与隐私控制、安全存储与有效利用等多层次、多角度形成了较为丰硕的档案数据技术治理成果,并讨论档案数据资源在人工智能生成内容(AIGC)、智能检索等领域的“潜力”。

(二)档案数据治理实践及战略研究

档案数据治理实践研究主要围绕两个方面展开:一是介绍和分析一个或多个国家或地区的档案数据治理具体实践,总结其模式、方法和教训。爱尔兰学者珍妮特·安德森(Janet Anderson)等介绍了“欧洲档案文件和知识保存项目”(European Archival Re? cords and Knowledge Preservation,E-ARK)。[36]法国学者诺拉·埃·卡蒂姆(Nora El Qadim)探讨了摩洛哥国家档案馆(Archives duMaroc)的数字化政策,认为摩洛哥国家档案馆的创建与发展与国家提升透明度和“善治”的整体行为有较强的关联性。[37]英国朴茨茅斯大学博士生法比耶纳·沙默洛(Fabienne Chamelot)等基于非洲档案实践,从史学视角反思了非洲档案馆数字化转型过程中存在的知识产权、主权和治理等深层次问题。[38]二是对某一领域或行业的档案数据实践进行深入分析,提出值得推广的体制机制策略,主要涉及科学数据、网页与社交媒体文件、数字视听档案等。美国哈佛大学政治学教授加里·金(Gary King)在《科学》杂志发文指出,有价值的社会科学数据的大量增加,使分析、理解和解决许多重大社会问题成为可能,而支持数据共享、数据管理等多重功能的科学基础设施也面临严峻挑战。[39]法国学者帕斯卡尔·迪热尼(Pascal Dugenie)等以“欧洲数据基础设施”(European Data,EUDAT)项目的科学数据管理实践为案例,发现信息技术的兴起给计算档案学(computational archival science)在评估大数据平台和知识生产生态系统方面提供了研究潜力。[40]奥地利维也纳大学传播学系教授、著名媒体治理专家凯瑟琳·萨利卡克斯(Katharine Sarikakis)等人以数字视听档案治理实践为基础,探讨了如何兼顾版权与文化政策的欧洲数字内容治理的路径与方式。[41]

随着世界各国政府信息化和社会数字化转型的深化,自企业管理、公共管理等领域的IT治理、电子治理、信息治理和数据治理等术语应运而生并对档案学研究产生不同程度的影响。

20世纪90年代出现的IT治理是一个含义广泛的术语,其主要任务是保持IT过程与业务目标一致,注重管理IT资源、IT过程及与IT相关的风险。但由于这一概念源自企业管理领域,而国外档案信息化领域的主要研究对象是公共档案,因此其影响较为有限。荷兰国家档案馆战略咨询专家雅妮娜·德·吉耶(Jeanine de Gier)在荷兰市政当局开展两个实证案例研究之后认为,信息管理的数字化在短时间内改变了档案部门并对政府组织内的信息流程产生了重大影响,而成熟的IT治理可以对数字文件信息管理产生积极的影响。[42]

2003年电子治理作为一个学术概念被正式提出,它是电子政务发展的延伸、深化和演进的新趋势,是借助信息通信技术建构运转有序、信息通畅、各行为主体及社会资源相互影响并共同促进而形成支持科学决策的多层次治理形态。[43]电子治理既产生于公共管理领域,又与电子文件管理具有紧密的联系,因此受到国外档案学界的广泛重视。瑞典吕勒奥理工大学的玛丽·鲁纳多特(Mari Runardotter)等认为,电子政务不仅改变了生产力、治理以及政府部门间的协调与合作,也改变了包括档案工作在内的许多公共部门雇员的日常工作实践。其在分析档案工作者的数据管理实践之后指出,档案工作者有限的权力和影响力让他们难以单独履行电子档案的“善治”职责,因此需要合理分配电子档案治理的实际责任、技术责任和战略责任。[44]澳大利亚学者阿德里安·坎宁安(Adrian Cunningham)等认为,“为电子治理和电子民主提供长期可用的电子格式信息是一项公共产品”,为此制定相关的国家战略是有必要的,并强调图书馆和档案馆等信息管理机构在支持数字时代的透明和负责任的治理方面应发挥重要作用。[45]德国联邦档案馆的安格利卡·蒙尼-哈里茨(Angelika Menne-Haritz)则认为,为了提升行政部门间电子通信的效率,需要从档案学和行政学的双重视角探讨电子文件管理,并以“电子治理”框架来应对电子政务背景下电子文件长期归档和可持续访问等重大挑战。[46]非洲档案学者尤斯图斯·瓦姆科亚(Justus Wamu? koya)[47]、林恩·伍尔弗雷(Lynn Woolfrey)[48]等探讨了电子治理视角下非洲地区的电子文件管理状况对提升政府治理水平、实现“善治”的重要价值及意义。

信息治理是机构治理的一个子集,包括文件和信息管理、信息安全、数据隐私和保护、内容管理、IT管理、风险管理、法规遵从、数字长期保存和分析及信息经济等关键概念。[49]由于文件管理是信息治理的重要内容,因此国外学者多从信息治理视角探讨电子文件管理的框架及优化问题。英国学者伊丽莎白·谢泼德(Elizabeth Shepherd)[50]和凯瑟琳·玛丽·乔利(Kath? erine Mary Chorley)[51]从信息治理视角考察了英国《信息自由法》和英国开放政府数据运动对英国地方政府文件管理服务工作的影响。澳大利亚学者乔安妮·埃文斯(Joanne Evans)等研究了“家庭外护理”(out-of-home Care)部门的文件保管治理需求,构建了具有共享所有权、管理权、互操作和参与式等核心特质的“参与式信息治理”概念框架,以回应算法时代社会、政治和文化对文件保管的要求。[52]

近年来,由于电子政务、电子治理等技术驱动的“电子”理论无法为以“数据流动”为特征的新现象、新工具、新问题提供社会理论支持,因此建立数据驱动的理论视角就成为一种迫切需求。数据治理作为一种新的理论和工具范式,也开始被引入档案学界来评估档案机构的数据管理活动。[53]随着数据跨境流动的活跃而带来的深層次数据治理问题逐渐凸显,加拿大多伦多大学信息学院菲奥雷拉·福斯卡里尼(Fiorella Foscarini)等人探讨了欧盟《通用数据保护条例》(General Data Protection Regulation)中关键档案术语和概念的本土化翻译问题,分析了这些误读对非英语国家档案数据治理实践可能产生的影响。[54]

三、风险:档案数据服务的信任危机及防范

档案数据治理实践不可避免带来政府信任挑战、个人隐私泄露风险和职业伦理危机等重要风险问题。

由于数字档案的流动性本质及其伴随的动态性、多样性,以及档案数据共享及再利用过程中的数据提供者、数据利用者和数据主体等多元利益相关者的复杂关系,[55]数字时代档案的信任机制重构问题成为研究热点。早在2012年,露西安娜·杜兰蒂等就曾指出,当前为数字文件系统提供真实性、准确性和可靠性保障的国际主流解决方案所需经费超出大多数组织机构的承受,越来越多的组织机构在云计算基础设施中存储和访问文件,而这既超出了传统档案鉴定的理论框架,又面临法律和监管体系暂时缺位的风险,[56]此后她又进一步分析了公、私机构采用云服务来存储文件的数据安全风险,并提出了相关的技术防范措施[57]。英国学者安娜·塞克斯顿(Anna Sexton)等人对英国2014—2017年教育、交通、能源、卫生健康领域的行政数据共享和再利用问题的相关案例深入分析后发现,仅仅通过制度化地划定合法数据共享的边界并不足以获得公众信任,还必须就数据共享的基本道德达成共识,才能产生更大程度的集体信任。[58]英国学者杰佛里·杨(Geoffrey Yeo)指出,尽管网络环境下档案信任机制的建立面临多重困难,但档案馆和档案工作者在保障信任方面仍将发挥关键作用。[59]美国学者德万·雷伊·唐纳森(Devan Ray Donaldson)通过实证研究发现,用户对档案馆的信任和对数字档案内容的信任呈正相关关系。[60]

大数据时代,无处不在的信息设备在随时随地收集个人信息的同时已经打破了个人和公共空间的界限,人们通常所认为的私人空间在更大的信息领域已然成了公共空间,[61]因此应对数字时代信任挑战的要点之一,就是要正确认识和妥善处理档案数据治理中的个人隐私风险。由于互联网环境下政府数字文件的保存、管理与公开利用面临着经济、技术及政策等多方面的严峻挑战,档案数据开放的安全风险、开放利用与隐私权的平衡难题等成为学者们关注的焦点。大数据时代的隐私问题折射出技术这把双刃剑背后工具理性和价值理性的断裂:为了达到更大限度的共享,人们尝试将隐私数据匿名化,但是数据匿名化会降低数据价值和数据可利用性。[62]安娜·塞克斯顿等人认为行政数据的共享利用可以促进行政效率的提升,但其与商业化开发的过度结合则极易带来个人隐私泄露的风险,因此相关机构在开展数据审计过程中一方面要保持适当的监管力度,另一方面要避免过度审计,而建立在公众合作基础上的智能问责制则是个人数据隐私风险治理的重要手段。[63]档案数据开放与利用中的隐私保护问题是一个跨学科研究热点。针对美国国家档案馆停止接收非电子档案进馆政策带来公共数字档案激增及其后续可能的开放、获取等难题,美国波士顿大学法学院的贾森·R.巴伦(Jason R. Baron)等建议采用社会网络分析、情感分析、可视化分析等大数据技术来辅助识别与发现数字档案中的个人身份信息或其他敏感及涉密内容,从而在保护隐私的同时,提高公共数字档案的开放及利用水平。[64]加拿大学者蒂姆·哈钦森(Tim Hutchinson)则尝试用“监督式机器学习”来识别人力资源类文件和包含个人信息的文件,并证明这是一种可行的保护隐私的技术方案。[65]

近年来社会大众的数据保存行为的政治学分析颇受关注,档案行动主义(archival activism)与数据行动主义(data activism)作为大数据时代“政治行动主义”(political activism)的重要组成部分,引起了学术界的重要关注。前者关注的是档案作为维护人权和社会正义的斗争工具的象征意义,后者则重视与技术产业领域相关的生物、气候、地理、交易等重要数据背后的政治、经济和文化权力。[66]由此,数据归档的政治隐喻及背后的数据行动主义成为近年来数据治理风险研究的热点话题。爱丁堡大学数据与社会研究专家摩根·E.柯利(Morgan E. Currie)等学者认为,“环境数据治理倡议工作组”(Environmental Data Governance Initiative,EDGI)发起的“数据营救”(Data Rescues)项目充分利用档案理念来保存数据,且该项目设计的软件融合了保管链、来源原则、多副本等档案核心理念。[67]事实上,面对剧烈的技术与社会变革,如何在加强档案职业与其他行业协作的同时保持自身的独立性,已经成为大数据时代国外档案学界关注的重大伦理问题。美国学者安东尼·科乔洛(Anthony Cocciolo)注意到档案工作者与数字资产管理师(Digital Asset Managers)之间的紧张关系,建议两者要专注于自己的核心使命,在数字世界不断发展中互相为对方创造成功的机会,从而缓解双方的紧张关系。[68]英国档案学者杰佛里·杨认为,在大数据和数据分析重要性日益凸显的当下,运用文档理念与方式来修复、固化和管理“原始数据”(raw data)的档案行业依然不可或缺,但档案工作者应与信息管理同行们加强合作,构建信息以应对社会数字化转型带来的共同挑战。[69]加拿大学者艾丽莎·哈默(Alyssa Hamer)认为,档案职业伦理、隐私权、政府责任等问题则需要档案从业者以更为开放的心态、更为专业的业务指导来应对数字时代的挑战。[70]

總之,面对大数据时代的全新挑战,国外档案学者采用坚守和发展相结合的视角看待档案大数据现象及其治理问题,坚持将档案核心原则引入数据资源管理体系,在电子治理、信息治理和数据治理等多元框架下探索文档数据资源治理的新模式、新路径,并在积极构建档案数据范式的过程中提升了档案学在数智时代的学科版图和社会影响力。

*本文系国家社科基金一般项目“国家大数据战略背景下档案数据治理体系构建研究”(项目编号:19BTQ097)的研究成果之一。

注释及参考文献:

[1]RHOADS J B.The historian and the new tech? nology[J].The American Archivist,1969,32(3):211-212.

[2]ROSE R.Dynamics of data archives[J].Social Science Information,1974,13(6):91-107.

[3]COOK M.Information management and ar? chival data[M].London:Library Association Publishing, 1993.

[4]STOLER A L.Colonial archives and the arts of governance[J].Archival Science,2002,2(1-2):87-109.

[5]COOK T.Macro-appraisal and functional anal? ysis:documenting governance rather than government[J].Journal of the Society of Archivists,2004,25(1):5-18.

[6]DURANTI L,THIBODEAU K.The concept of record in interactive,experiential and dynamic envi? ronments:the view of the interPARES[J].Archival Sci? ence,2006,6(1):13-68.

[7]TRACE C B.Beyond the magic to the mecha? nism computers,materiality,and what it means for re? cords to be“Born Digital”[J].Archivaria,2011(72):5-27.

[8]BAK G.How soon is now?writings on digital ar? chiving in Canada from the 1980s to 2011[J].The Amer? ican Archivist,2016,79(2):283-319.

[9]GILLILAND A J.Conceptualizing 21st-centu? ry archives[M].Chicago:Society of American Archivists, 2014.

[10]MILLAR L.On the crest of a wave: transform? ing the archival future[J].Archives and Manuscripts, 2017,45(2):59-76.

[11]MOSS M.Without the data,the tools are use? less;without the software,the data is unmanageable[J]. Journal of the Society of Archivists,2010,31(1):1-14.

[12]MOSS M,THOMAS D,GOLLINS T.The re? configuration of the archive as data to be mined[J].Archi? varia,2018(86):118-151.

[13]SKLARELD A S,GIDLUND K L.Rethinking archives as digital:the consequences of“Paper Minds”in illustrations and definitions of e-archives[J].Archivaria, 2017(83):81-108.

[14]LARSON E.Big questions:Digital preserva? tion of big data in government[J].The American Archi? vist,2020,83(1):5-20.

[15]SODRINGT,REINHOLDTSENP,MASSEY D.A record-keeping approach to managing IoT-data for government agencies[J].Records Management Jour? nal,2020,30(2):221-239.

[16]MCLEOD J.Record DNA:reconceptualising digital records as the future evidence base[J].Archival Science,2023,23(3):411-446.

[17]POOLE A H.How has your science data grown?Digital curation and human factor:a critical liter? ature review[J].Archival Science,2015,15(2):101-139.

[18]MORDELL D.Critical questions for archives as (big) data[J].Archivaria,2019(87):140-161.

[19]SOBCZAK A.Public cloud archives:dream or reality?[J].Canadian Journal of Information and Library Science,2015,39(2):228-234.

[20]BORGLUND E A M.What about trust in the cloud?Archivistsviews on trust[J].Canadian Journal of Information and Library Science,2015,39(2):114-127.

[21]SHIBAMBU A,MARUTHA N S.A frame? work for management of digital records on the cloud in the public sector of South Africa[J].Information Discov? ery and Delivery,2022,50(2):165-175.

[22]NESMITH T.The cloud,the public square, and digital public archival infrastructure[J].Archival Sci? ence,2023,23(3):501-525.

[23]CLOUGH P,TANG J,HALL M M,et al. Linking archival data to location:a case study at the UK National Archives[J].Aslib Proceedings,2017,63(2/3): 127-147.

[24]DINGWALL G,MARCIANO R,MOORE R,et al.From data to records:preserving the geographic information system of the city of vancouver[J].Archivar? ia,2017(64):181-198.

[25]BHATIAS,DOUGLAS E K,MOST M. Blockchain and records management: disruptive force or new approach?[J].Records Management Journal, 2020,30(3):277-286.

[26]FRANKS P C.Implications of blockchain dis? tributed ledger technology for records management and information governance programs[J].Records Manage? ment Journal,2020,30(3):287-299.

[27]LEMIEUX V L,ROWELL C,SEIDEL M L,et al.Caught in the middle?Strategic information gov? ernance distruptions in the era of blockchain and distrib? uted trust[J].Records Management Journal,2020,30(3): 301-324.

[28]ROLAN G,HUMPHRIES G,JEFFREY L,et al.More human than human?Artificial intelligence in the archive[J].Archives and Manuscripts,2019,47(2): 179-203.

[29]AANGENENDT G.Archives in the Digital Age:the use of ai and machine learning in the Swedish archival sector[D].Uppsala:Uppsala Universitet,2022.

[30]TZOUGANATOU A.Openness and privacy in born-digital archives:reflecting the role of AI devel? opment[J].AI & Society,2022,37(3):991-999.

[31]JAILLANT L,CAPUTO A.Unlocking digital archives:cross?disciplinary perspectives on AI and born? digital data[J].AI & Society,2022,37(3):823-835.

[32]BUNNJ.Working in contexts for which transparency is important- A recordkeeping view of ex? plainable artificial intelligence (XAI) [J].Records Man? agement Journal,2020,30(2):143-153.

[33]CHABIN M A.The potential for collaboration between AI and archival science in processing data from the French great national debate[J].Records Manage? ment Journal,2020,30(2):241-252.

[34]DAVET J,HAMIDZADEH B,FRANKS P. Archivist in the machine:paradata for AI?based automa? tionin the archives[J].Archival Science,2023,23(2):275-295.

[35]RANDBY T, MARCIANO R. Digital cura? tion and machine learning experimentation in archives[C]//2020 IEEE International Conference on Big Da? ta,Dec 2020,Atlanta,GA,USA.New York:IEEE,2020: 1904-1913.

[36]ANDERSON J,AAS K,ANDERSON D,et al.The EARK Project:An introduction to the European archival records and knowledge preservation project[J]. New Review of Information Networking,2020,25(2): 83-92.

[37]QADIM N E.Born digital?digitization and the birth of the moroccan national archives[J].History in Af? rica,2020(47):195-218.

[38]CHAMELOT F,HIRIBARREN V,RODET M.Archives,the digital turn,and governance in Africa[J]. History in Africa,2020(47):101-118.

[39]KING G.Ensuring the data-rich future of the social sciences[J].Science,2011,331(6018):719-721.

[40]DUGENIEP,NUNOFREIRE,DAANBRO? EDER.Building new knowledge from distributed scien? tific corpus:HERBADROP & EUROPEANA:Two concrete case studies for exploring big archival data[C]// 2017 IEEE International Conference on Big Data (Big Data),Dec2017,Boston,MA,USA.NewYork:IEEE, 2017:2231-2239.

[41]SARIKAKIS K,KOLOKYTHA O,ROZGO? NYI K.Copyright (and) Culture:the governance of au? diovisual archives[J].Info,2016,18(6):42-54.

[42]GIER JD.IT governance of dutch munici? palities and digital information management[J].New Re? view of Information Networking,2018,23(1-2):36-46.

[43]孟庆国,关欣.论电子治理的内涵、价值与绩效實现[J].行政论坛,2015(4):33-34.

[44]RUNARDOTTERM,M?RTBERGC, MIRIJAMDOTTER A.The changing nature of ar? chives:whose responsibility?[J].Electronic Journal of eGovernment,2011,9(1):68-78.

[45]CUNNINGHAM A, PHILIPS M. Account? ability and accessibility:ensuring the evidence of e-gov? ernance in Australia[J].Aslib Proceedings:New Informa? tion Perspectives,2005,57(4):301-317.

[46]MENNE-HARITZ A.Electronic records and electronic governance[J].Archivar,2006,59(3):259-264.

[47]WAMUKOYA J,MUTULA S M.E- records management and governance in East and Southern Afri? ca[J].Malaysian Journal of Library & Information Sci? ence,2005,10(2):67-83.

[48]WOOLFREY L.Knowledge utilization for governance in Africa:evidence-based decision-making and the role of survey data archives in the region[J].In? formation Development,2009,25(1):22-32.

[49]张敏.信息治理视域下的关键文件管理策略研究[J].北京档案,2023(2):12-13.

[50]SHEPHERD E,STEVENSON A,FLINN A. Information governance,records management,and free? dom of information:A study of local government author? ities in England[J].Government Information Quarterly, 2010,27(4):337-345.

[51]CHORLEY K M.The challenges presented to records management by open government data in the public sector in England:A case study[J].Records Man? agement Journal,2017,27(2):149-158.

[52]EVANS J,MCKEMMISH S,ROLAN G.Par? ticipatory information governance:transforming record? keeping for childhood out- of- home care[J].Records Management Journal,2019,29(1/2):178-193.

[53]WULANDARI S A,RULDEVIYANI Y,SU? WIYANTO V,et al.Data governance maturity level at the national archives of the republic of indonesia[J].Jur? nal Penelitian Pos dan Informatika,2020,10(1):27-40.

[54]FOSCARINI F,BARRERA G,BABIC A?, et al.The language of the GDPR translation issues and archival issues in four non-English-speaking countries[J].Archives and Manuscripts,2021,49(1-2):62-87.

[55] [63]SEXTON A,SHEPHERD E,DUKEWILLIAMS O,et al.A balance of trust in the use of gov? ernment administrative data[J].Archival Science,2017,17(4):305-330.

[56]DURANTI L,ROGERS C.Trust in digital records:an increasingly cloudy legal area[J].Computer Law & Security Review,2012,28(5):522-531.

[57]DUREANTI L,JANSEN A.Records in the cloud:authenticity and jurisdiction[C]//2013 Digital Heritage International Congress (DigitalHeritage) ,2013, Marseille,France.New York:IEEE,2013:161-164.

[58]SEXTON A,SHEPHERD E,DUKE- WIL? LIAMS O,et al.The role and nature of consent in gov? ernment administrative data[J].Big Data & Society,2018, 5(2):1-17.

[59]YEO G.Trust and context in cyberspace[J].Ar? chives and Records,2013,34(2):214-234.

[60]DONALDSON D R.Trust in archives–trust in digital archival content framework[J].Archivaria,2019(88):50-83.

[61][62]高玉宝.档案管理与个人信息保护的平衡研究[J].档案与建设,2023(4):33-37.

[64]BARON J R, BORDEN B B.Opening up dark digital archives through the use of analytics to iden? tify sensitive content[C]//2016 IEEE International Conference on Big Data (Big Data),Dec 2016,Washing? ton,USA.New York:IEEE,2016:3224-3229.

[65]HUTCHINSON T.Protecting privacy in the archives:supervised machine learning and born- digital records[C]//2018 IEEE International Conference on Big Data (Big Data),Jan 2019,Seattle,USA.New York: IEEE,2019:2696-2701.

[66]DENCIK L,HINTZ A,CABLE J.Towards da? ta justice?The ambiguity of anti-surveillance resistance in political activism[J].Big Data & Society,2016,3(2).

[67]CURRIE M E,PARIS B S.Back-ups for the future:archival practices for data activism[J].Archives and Manuscripts,2018,46(2):124-142.

[68]COCCIOLO A.When archivists and digital as? set managers collide:tensions and ways forward[J].The American Archivist,2016,79(1):121-136.

[69]YEO G.Records,Information and data:explor? ing the role of record-keeping in an information culture[M].London:Facet Publishing,2018.

[70]HAMER A.Ethics of archival practice: new considerations in the digital age[J].Archivaria,2018(85): 156-179.

作者單位:山东大学历史学院

猜你喜欢
大数据时代
大数据时代互联网金融冲击下商业银行发展的SWOT分析
大数据时代档案管理模式的转换与创新
大数据时代宏观经济分析的相关探讨
智慧城市与大数据时代的政府治理
大数据时代互联网金融对传统商业银行的影响研究
大数据时代下计算机信息处理技术的应用
大数据时代背景下高职院校宣传思想工作的思考与实践
大数据时代下图书馆的服务创新与发展
大数据时代高校学生知识管理
从“数据新闻”看当前互联网新闻信息传播生态