大数据环境下高校机构知识库建设研究

2016-05-30 06:20刘方徐州工程学院图书馆江苏徐州221000
图书馆学刊 2016年1期
关键词:知识库机构图书馆

刘方(徐州工程学院图书馆,江苏徐州221000)



大数据环境下高校机构知识库建设研究

刘方
(徐州工程学院图书馆,江苏徐州221000)

[摘要]针对大数据时代背景下国内外高校机构知识库的实际应用情况、现存问题和未来对图书馆服务调整的影响等进行深入的分析与总结,揭示高校机构知识库的建立和运行与科研数据管理的内在联系,从而对大数据时代高校机构知识库完善和发展以及图书馆知识服务模式革新有借鉴作用。

[关键词]大数据高校机构知识库图书馆知识服务

[分类号]G258.6

1 大数据背景下的高校机构知识库

随着大数据时代的到来,信息技术的快速发展和资源数字化的不断跟进在方便人们检索和利用资源的同时,数字资源的长期保存问题也变得日益突出。据相关研究统计,目前网页的平均寿命大约仅为44天,因此,很多有价值的数据资源随时都有可能永久性地消失[1]。具体到高校而言,作为主要的学术机构和科研重地,大量极具学术价值的灰色资源如科技报告、年度报告、实验数据、专利文件计划或蓝图等基本上都分散在研究者自己手中,并未得到广泛传播和充分利用[2]。此外,在信息技术迅速发展的今天,作为学术交流与传播重要途径的传统出版方式已经开始出现与其初衷背道而驰的局势。因此,高校等学术研究机构如何对本机构所产生的海量科研数据等学术资源进行有效管理和传播已成为学术界普遍面临的一个挑战[3]。在此背景下,以高校图书馆为主体的机构知识库应运而生,作为一种新型的学术交流方式和出版形式正在被越来越多的人们认同,其目的是实现学术资源的建设、共享和利用[4]。

关于什么是机构知识库(Institutional Repository,简称IR)、何谓高校机构知识库,国内外的研究者对此提出了不同的见解和看法,目前尚无统一定论。各研究者观点的提出大多基于自身的研究视角和对高校机构知识库价值评判的理解。比较著名的是国外研究者Clifford A. Lynch的观点,他从高校的角度分析,将机构知识库理解为高校提供的用于管理和传播机构成员研究成果的一系列服务系统[5]。

2 高校机构知识库的应用与发展现状

2.1国际现状

就国际高校机构知识库的发展情况而言,自从机构知识库的开发工具Dspace产生以后,国内外机构知识库迅速发展。截至2014年,在Registry of Open Access Repositories (ROAR)注册的全球机构知识库已经达到3621个,分布于100余个国家或地区,其中欧美在机构知识库数量占据绝对优势,美国以总数522排名第一,英国228排名第二,西班牙在机构知识库发展方面也取得了较大发展,以总数150排名第三。

表1 世界各国机构知识库建设情况

目前全球机构知识库建设事业发展存在严重失衡问题,美国、英国等教育强国、发达国家在机构知识库的数量上远远超过了其他国家或地区。原因主要在于很多高校的管理层和决策层并未认识到构建机构知识库的重要性,而且不少机构知识库在建设完成后,运行期间的管理和维护工作都未充分落实,责任机构不明确的现象比较普遍,导致很多高校机构知识库不能够长期运行,实现持续、健康发展[6]。高校机构知识库是机构知识库的主要类型,高校不仅盛产科研成果,而且是人才集中场所,因此科研生产力和科研需求都非常明显,高校已成为机构知识库发展的主要推动力。

2.2国内现状

就国内高校机构知识库的发展情况而言,据统计,截至2011年10月被Open DOAR收录的国内高校机构知识库仅有32个,其中包括6个香港大学创建和1个澳门大学创建的机构知识库[7]。2011年8月正式实施的CALIS三期机构知识库建设及推广项目是推进国内高校机构知识库建设非常关键的一步,该项目实施情况可在一定程度上反映我国机构知识库的应用及发展现状。通过网站调研发现,针对高校科研数据管理,由北京大学图书馆、北京理工大学图书馆、重庆大学图书馆、清华大学图书馆和厦门大学5个示范馆发起,目前全国有29所高校建立了自己的机构知识库。北部地区11所,西部地区5所,东部地区5所,南部地区8所,中部地区和港台地区尚未覆盖,其中“985”工程高校有14所。表2对14所“985”工程高校机构知识库的数据管理机构、数据来源、数据类型、数据量、开放政策、软件技术以及访问量等情况进行了详细统计。

表2 “985”工程高校图书馆机构知识库统计概览

从表2可以看出,相对于国外而言,目前我国还处于机构知识库建设初期,发展较为缓慢且存在数据量少、数据类型单一、利用率不高、开放获取和共享程度低等问题,同时在技术方面仍需不断突破和加强。

2.3相关技术发展

目前,国内外高校机构知识库的建设在技术上主要采用两种方法:一是采用开放源码软件,用于机构知识库的建设;二是采用商业软件,用于机构知识库的建设。出于建设成本的考虑,大多数高校都更加倾向于采用开放源码软件。根据实际需求,各软件系统开发商及不同领域的专家学者对高校机构知识库应用的开放源码软件进行了开发和研究。

高校机构知识库建设过程中发展比较成熟的开放源码软件系统主要有DSpace、EPrints、Fedora、CDSware、Green⁃stone、ARNO、i-TOR、eDoc等,笔者通过网站调研对各软件的实际应用情况进行了统计。表3是目前世界各国机构知识库软件系统的使用情况。DSpace是应用最为广泛的软件系统之一。此外,Christopher Gutteridge还针对EPrints的特点、设计理念、结构以及建立EPrints知识库所需的时间成本进行了深入分析[8]。关于Fedora的研究比较经典的是Sandra Payette 和Carl Lagoze,他们在对Fedora结构层、界面层、数字对象权利管理以及管理层等方面进行介绍的基础上,进一步指出了Fedora软件系统所面临的一些挑战,比如动态代码的安全性、权利管理政策界定、可靠的复制机制等,认为解决上述问题是Fedora取得长足发展的当务之急[9]。Open Society Insti⁃tute在机构知识库软件指南中从系统设计与管理、内容管理与传播以及系统维护等方面对Archimede、ARNO、CDSware、EPrints、Fedora、i-Tor、MyCoRe、OPUS几个常用软件系统进行了对比分析[10]。William Nixon根据EPrints与DSpace在Glasgow大学实际运行情况,对比分析了二者实施过程中在运行环境需求、系统构造、提交过程等方面的差异,并提出了二者各自有待完善和改进的地方[11]。与此同时,国内学者们也对高校机构知识库软件系统进行了多方面的研究和讨论,董丽等对Fedora和DSpace进行了比较,指出二者都是基于开放和模块化的体系结构,支持数字对象的长期保存,以通用METS标准为数据交换格式并且都具有良好的跨平台性,二者间的差异主要表现在处理数据方式、信息模型、数据导入导出支持、元数据灵活程度、快速开发、对内部数据管理与访问方式、可扩展性以及易用性等方面[12]。陈和以厦门大学机构知识库建设实践为依据,详细分析了DSpace系统在厦门大学机构知识库构建中的具体应用情况[13]。李广建等通过研究发现开放存取和数字对象管理技术是高校机构知识库实现内容组织和长期保存、互操作和开放存取的关键[14]。

通过上述研究,增进了我们对机构知识库开放源码软件的了解,明确了各系统软件的优缺点,为今后机构知识库系统的选择与评估提供了宝贵经验。不难发现,目前高校机构知识库系统的发展在技术方面已经比较成熟,开发出了大量系统软件、安装工具,但高校在构建机构知识库的过程中决不能盲目选择,而要根据本校师生及科研工作者的实际需求,综合建设成本等各方面因素做出合理的判断。

表3 世界各国机构知识库软件使用情况

3 高校机构知识库构建存在的问题

3.1内容建设与质量控制问题

对于高校机构知识库而言,与存放内容、收集科研数据同等重要的就是要保证资源的可用性和学术价值,内容建设是高校构建机构知识库过程中需要首要考虑的问题,否则大部分工作只能流于形式。高校师生及科研人员既是机构知识库资源的提供者,又是其使用者。但相关研究发现多数科研人员考虑到数据或研究成果提交机构知识库之后很有可能被同行看到,所以不愿意提交自己手中有价值的科研数据,这在很大程度上阻碍了高校机构知识库的内容建设。另外,国内高校机构知识库在质量控制方面也缺乏有效合理的机制和手段,尚未制定出学术成果提交的元数据标准及质量控制规范,专家评审或同行评议制度也不够完善。因此,高校机构知识库的构建与运行及时出台合理的政策法规以及评审或评议制度是当务之急。就目前的发展情况而言,中国科技论文在线的评审或评议制度值得参考和借鉴[15]。

3.2政策宣传与软件技术问题

高校机构知识库规划建设的主体和推动者是高校图书馆管理决策层。但很大一部分管理者对机构知识库的认知程度并不高,特别是在系统设计和数据挖掘等方面。将机构知识库与其他专业数据库混为一谈、对机构知识库涉及的版权问题认识不清等现象普遍存在。很多管理者基于以上种种原因对机构知识库建设持消极态度,在政策上未能给予相应的支持,这不仅直接加大了高校机构知识库建库的难度,而且对之后机构知识库的宣传推广也十分不利。此外,高校在构建机构知识库的过程中软件工具的选取十分关键,但目前国内高校在DSpace、Eprints、Fedora、ARNO、CDS ware等商业软件的选取上并无统一标准,对各软件系统的功能特点的认识存在偏差,还有些高校或科研机构自行开发软件建立本单位的机构知识库系统。这就造成了高校机构知识库发展水平参差不齐,系统质量缺乏保障等问题。

3.3版权许可与法律纠纷问题

一旦高校机构知识库涉及数字资源的管理和利用,其所面临的一项严峻挑战就是版权许可问题。机构知识库必须明确其所收集到的数据资源的版权持有者,这对于高校图书馆来说将是一项十分繁重的任务。由于版权具有时效性并且大多由作者的卒年月决定,如果不明确作者,则版权的终止日期将无法界定。这必将加大机构知识库资源数字化和数据共享的难度。因此,高校机构知识库做出的许多关于版权方面的决定有可能引起使用方与版权所有人之间的权益纠纷[16]。

3.4经费支持问题

高校机构知识库长期、稳定发展的一个决定性因素是持续的经费保障。2007年,由美国的密歇根州大学提供资助,为了解美国大学机构知识库发展现状,MIRACLE项目在全美范围内对科研型图书馆的2147名领导者和员工进行了调研。在有关“在机构知识库建设、运作过程中,最为关心的相关事务是什么”的调研结果中,排在前三位的分别是“机构知识库的实施费用”“机构知识库的维护费用”和“机构知识库的规划设计费用”。此外,在对“为什么不计划构建机构知识库”一题的回答中也有不少高校将经费不足列为主要原因[17]。在国内,经费问题同样也是影响高校机构知识库发展的一个主要因素。

4 基于机构知识库的知识服务变革

4.1加强资源整合

随着高校机构知识库的建立,图书馆在服务模式、工作流程、组织结构等方面也将进行相应调整。机构知识库的建设能够促进高校图书馆资源的整合,这是高校图书馆进行服务创新的重要推动力,对于高校科研工作具有很高的应用价值。从高校图书馆资源建设的角度来讲,机构知识库中的这部分科研数据可作为馆藏体系的有效补充,通过资源整合为图书馆知识服务工作的开展提供技术和资源保障,图书馆将会在知识服务方面发挥越来越重要的作用[18]。在未来的发展过程中,知识服务将成为图书馆职能调整的一大突破口,而机构知识库则会为这一调整提供技术和资源的双重保障。

4.2馆员服务角色的重定位

高校机构知识库的构建对图书馆员的职业发展也会产生深远影响,高校馆员可在图书馆机构知识库运行体系下转变角色,发挥更加积极的作用。Charles W. Bailey Jr在其研究中从政策制定、系统涉及、出版变革和用户培训等方面明确了图书馆员在机构知识库运行过程中的职责和作用[19]。Diana L.H. Chan根据实践经验指出图书馆员在内容收集、机构知识库系统评估、制定与政策解释、交流沟通以及参考帮助等方面扮演着重要角色[20]。Suzie Allard在对相关研究进行总结分析之后明确定位了图书馆员在机构知识库建设中所扮演的角色:①了解机构知识库软件系统;②监督本地机构知识库项目管理与规划;③为集合界定提供指南;④制定适合每个集合的简单明确的元数据标准;⑤评价控制提交内容的质量,保证元数据的一致性;⑥培训作者利用机构知识库[21]。

4.3科研数据管理

数据管理是为了将来可以重复利用,这也是高校机构知识库的发展要义之一。随着大数据时代的到来,简单的数据获取服务已无法满足用户日益增长的数据需求,为此,图书馆需进一步开展对科研数据的深层分析服务。这就意味着图书馆需要在其服务中嵌入更多的智力因素,将科研数据和与之相关的文献资料联系起来,更好地满足用户的信息需求[22]。而高校机构知识库是在信息时代数据膨胀、科研需求层次不断提升的背景下应运而生的,该系统的构建及推广必将为图书馆服务模式的转变提供新契机。

5 结语

高校机构知识库是存录、传播、展示和分享机构科研、教研成果的知识服务平台,是高校发展的动力源泉。机构知识库的发展经历了Web2.0、Cloud时期后,正逐渐迈进大数据时代。数据挖掘和知识提取工具的完善为机构库建设创造了良好的基础条件,对加强资源整合、重新定位馆员服务位置、优化馆员知识服务能力等方面有着巨大的促进作用。RSS聚合、Twitter、Blog、Instant Messaging、Wikis、Tagging、社交网络、跨语言搜索引擎等Web2.0嵌入技术的应用是高校机构知识库的完善和发展的强有力的技术支持和保障。

综上所述,具有大数据特征的高校机构知识库和知识服务模式研究是大数据时代前沿性研究课题,必须从资源和服务,技术和管理角度加以可行性论证,从而加强机构知识库的服务功能创新。

参考文献:

[1]丁丽鸽.国外网络信息资源保存研究及其对我国的启示[J].科技情报开发与经济,2007(25):114-115.

[2]李海蓉.网络学术资源的开放获取[J].情报探索,2006 (8):30-32.

[3]聂华.韦成府.崔海媛.CALIS机构知识库:建设与推广反思与展望[J].中国图书馆学报,2013(3):46-52.

[4]邓红.高校机构知识库建设实践与探索——以北京工业大学图书馆为例[J].现代情报,2013(7):80-83,129.

[5]Clifford A. Lynch. Institutional Repositories:Essential In⁃frastructure for Scholarship in the Digital Age.http://www. arl.org/bm~doc/br226ir.pdf 2014-4-2.

[6]魏瑞斌.高校机构知识库的应用研究[J].知识管理论坛,2013(5):1-10.

[7]张宏胜.中美高校机构知识库比较研究[J].信息工作究,2011(34):111-113.

[8]MacKenzie Smith,Mary Barton,Mick Bass,Margret Bran⁃schofsky,Greg McClellan,Dave Stuve,Robert Tansley,Ju⁃lie Harford Walker. DSpace:An Open Source Dynamic Dig⁃ital Repository[J].D-Lib Magazine,January 2003,Volume 9 Number1.http://www.dlib.org/dlib/january03/smith/01smith.html 2013-11-13.

[9]Christopher Gutteridge.GNU EPrints 2 Overview.http://eprints.ecs.soton.ac.uk/6840/02/eprintsoverview.pdf2014-04-18.

[10]Open Society Institute.A Guide to Institutional Repository Software. http://www.soros.org/openaccess/pdf/OSI_Guide _to_IR_Software_v3.pdf 2013-10-29.

[11]William Nixon.DAEDALUS:Initial experiences with EPrints and DSpace at the University of Glasgow. https://dspace.gla.ac.uk/bitstream/1905/197/1/initial_experienc⁃es_eprints_dspace.pdf2013-11-16.

[12]董丽,张蓓,邢春晓.开放源代码的数字资源管理系统DSpace和Fedora的分析比较[J].现代图书情报技术,2005(7):1-6.

[13]陈和.DSpace系统与厦门大学机构存储的构建[J].数字图书馆坛,2006(9):61-67,75.

[14]李广建,黄永文,张丽.机构知识库:现代体系结构与发展趋势[J].情报学报,2006(25)2:236-241.

[15]黄敏,周新跃,邵良杉.高校机构知识库构建策略研究[J].

中国教育信息化,2009(19):49-52.

[16]傅建秀.基于开放存取的机构知识库版权协议问题研究[J].图书与情报,2010(2):62-68.

[17]Karen Markey,Soo Young Rieh等著;谷秀洁编译.美国图书馆和信息资源委员会关于机构知识库的普查报告(摘要)——M机构知识库ACLE项目的研究发现[J].图书情报工作动态,2007(8):9-12.

[18]杨勇,张建中.机构知识库与高校图书馆知识服务的实现模式[J].情报科学,2009(2):409-412.

[19]Charles W. Bailey Jr.The role of reference librarians in in⁃stitutional repositories[J].Reference Services Review,Vol.33 No.3,2005,pp.259-267.

[20]Diana L.H. Chan,Catherine S.Y.Kwok,Steve K.F.Yip. Changing roles of reference librarians:the case of the HKUST Institutional Repository[J].Reference Services Re⁃view,Vol.33 No.3,2005,pp.268-282.

[21]Suzie Allard.The librarian.s role in institutional reposito⁃ries:A content analysis of the literature[J].Reference Ser⁃vices Review,Vol.33 No.3,2005,pp. 325-336.

[22]李晓辉.图书馆科研数据管理与服务模式探讨[J].中国图书馆学报,2011(9):46-52.

刘方女,1981年生。硕士,馆员。研究方向:图书馆管理和资源建设。

·信息组织·

收稿日期:(2015-04-22;责编:王天泥。)

猜你喜欢
知识库机构图书馆
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
图书馆
一周机构净增(减)仓股前20名
一周机构净增(减)仓股前20名
一周机构净增仓股前20名
一周机构净减仓股前20名
高速公路信息系统维护知识库的建立和应用
去图书馆
位置与方向测试题