我国图书馆科研数据管理服务需求的调查研究*

2022-11-08 09:18王友转
图书馆研究与工作 2022年11期
关键词:数据管理科研人员机构

王友转

(广东省科技图书馆 广东省科学院信息研究所 广东广州 510070)

1 引言

近年来,科研项目数量不断增加,项目类型多元化的趋势愈加明显,使管理人员对科研数据的管理方式及管理能力提出了更高要求[1]。图书馆集信息资源、文献数据、知识服务于一体,参与科研数据管理并提供相应的服务具有较大的优势,图书馆的学科馆员能够在科研数据的管理、维护和其他服务方面发挥重要作用。目前,国内部分图书馆较早地开展了用户信息素养教育,包括数据素养教育,为科研数据机构库乃至机构库联盟的建设奠定了良好基础。实践也证明,由图书馆替代科研人员管理和维护科研数据不仅能节省科研人员的时间和精力,还能为科研人员保存、传播与再利用科研数据提供便利和支持。资助机构也将更信任科研人员所存档数据的质量[2]。

从中国知网数据库以“图书馆”和“科研数据管理”为检索词,共检索到360余篇相关论文。从相关研究内容上看,国内学者的研究主要分为三大类:一是以马波[3]、孟祥保[4]、韩金凤[5]、张莎莎[6]等人为代表的对英、美、德、加等发达国家图书馆科研数据管理的调查和经验启示;二是国内图书馆开展科研数据管理服务的实践研究,如王怡等人研究了我国高校科研数据管理现状、困境及未来发展路径[7],孙清玉等人以河海大学图书馆为例,研究了基于机构知识库的高校图书馆科学数据管理服务[8];三是李航[9]、孙裕彤[10]、李晓辉[11]等人对国内科研数据管理服务体系和模式的构建研究。

关于图书馆开展科研数据管理服务的调查研究,均集中在对国外图书馆的开展服务和共享政策方面。由于国内开展科研数据管理服务时间较短,服务体系尚不完善。为了解我国科研人员科研数据管理和共享的现状、存在的问题,以及对图书馆在科研数据管理服务方面的需求,笔者设计了“图书馆科研数据管理服务需求调查问卷”。

2 调查内容与分析

本次调查时间为2021年4月7日—2021年6月9日,采用网络问卷调查和纸质问卷调查相结合的方式进行。纸质问卷主要通过在现场培训和会议期间向参会人员发放填写。网络问卷则通过同学、亲友、网站、微信公众号、科技查新用户等多种途径进行发放。共发放490份问卷,收回有效纸质调查问卷38份,有效网络问卷438份,共476份,有效回收率为97%。其中35岁及以下及中级职称的人数最多,分别为248人和203人。博士及以上学位111人,硕士118人,本科206人,大专41人。对回收问卷数据进行分析可以发现以下问题。

2.1 科研数据获取和管理

调查数据显示,科研人员获取科研数据的主要途径有:实验室、社会调查、网络采集、建模或模拟、实地观测等。而通过购买和同事亲友提供以及其他途径获得数据的较少。可见,国内科研人员数据主要来源于自己的原始数据,较少通过数据再加工使用。

收集和获取科研数据过程中遇到的困难主要有:收集到的数据不符合要求、数据获取成本高、难以找到所需数据三方面,而部分数据涉及隐私或国家机密以及其他困难较少。这些困难与我国科研数据公开共享程度低有一定关系。由于种种原因,我国一些行业或单位的数据库往往局限于本行业或本单位使用,缺乏单位间的数据流通,更没有形成公开的科研数据共享[12]。国家和地方发布的各类科技计划所产生的科研数据,并没有得到有效的管理和利用。如果能够提高我国科研数据管理与共享的水平,则有助于科研人员解决数据获取方面的困难。

数据管理满意度方面,54%的被访人员对目前科研数据管理和保存表示满意,19%的被访人员表示不满意。可见大部分被访人士需要提高数据管理和保存技能(见图1)。

图1 科研数据获取和管理情况

在管理和利用科研数据过程中遇到的困难主要有:缺乏有效的数据管理工具和软件;需要花费较多的时间和精力管理数据;数据容易丢失,如手误删除、数据损毁等,也有部分科研人员不知道索引和元数据如何创建,或者忘记数据存储位置。这说明科研人员缺乏科研数据管理的基本方法和必要技能。

被访人士中,66%的人表示研究团队没有专门的数据管理相关的工具和软件。可见,科研数据管理有关的软件和工具没有得到普及,或者说大部分研究团队并没有使用科研数据管理软件和工具的意识和习惯。

2.2 科研数据保存情况

调查显示,项目结束后科研数据主要去向有:项目负责人或者某个项目组成员手中,亦或是分散在项目组成员手中,少数会在图书馆或所在机构手上(见图2)。由此可见,大部分科研数据在项目结束后仍然以项目组成员之间的流通为主,数据对外共享程度并不高。因而,无论是国家、地方还是科研管理机构,在制定相关政策时,应充分考虑科研数据管理与共享目前存在的问题,发挥图书馆、第三方机构在数据管理方面的专业知识。

图2 科研数据存储情况

科研数据保存方式多种多样,主要有个人电脑、移动存储设备、机构电脑/机构库、纸质载体、网络硬盘等。科研数据保存时长方面,数据比较分散,其中,23%的人会永久保存,18%的被调研人员会视情况而定,14%的人会保存半年至1年,保存1—2年和保存3—5年的人数相当,保存1周—1月和保存1月—半年的人数相当。可见,对于科研数据的保存期限,并没有相对统一的标准和规定。国外相关研究也表明,科研数据的保存期限不能一概而论,应根据不同学科领域的特点、科研资助者的要求和数据的重要程度具体确定[11]。

数据丢失频率方面,79%的被访人士偶尔会丢失科研数据,14%的人从未发生数据丢失现象,剩下7%的人员经常出现数据丢失情况。超8成的科研人员有过数据丢失经历,可见我国科研人员对科研数据保存与管理的重视程度并不高,保存方式存在一定问题。因此,图书馆作为知识传播的媒介,有必要进一步加强科研人员对科研数据的保存与管理的认知,确保重要科研数据的安全性和可靠性。

数据丢失原因方面,主要有存储设备故障;失误操作或失误删除;数据转换或导入时出现故障;计算机或存储设备丢失等。这些原因都可以通过定期多种类备份等措施加以预防和避免,从而在一定程度上减少数据丢失情况的发生,以及由此带来的科研数据管理混乱。

2.3 科研数据共享情况

调查表明,51%的人士曾经无偿提供给他人科研数据,19%的人士曾有偿提供,剩下的30%没有或拒绝提供过(见图3)。

图3 科研数据共享情况

共享过数据的人士中,共享对象主要有:有合作关系的同行、科研团队成员、同事、同学或校友。愿意共享科研数据的主要原因有:互帮互助原则;相信对方会恰当使用自己共享的数据;现有数据对自己用处不大。而不愿意共享科研数据的主要原因有:担心数据被不正当使用;数据涉及保密问题,按规定不能公开;数据是靠自己努力收集到的,不愿意无偿共享给别人;担心数据安全问题,如被篡改、删除等;担心自己数据有问题,共享之后可能会被发现错误;担心同行会通过自己共享的数据得出不利于自己成果的结论。

2.4 调查对象对图书馆在科研管理中发挥作用的期待

调查发现,被访人士最希望图书馆或所在机构提供的科研数据管理服务有:数据分析处理、数据查找与获取、数据管理、数据交流与共享、数据咨询、数据保存。可见科研人员希望图书馆或所在机构能够参与到科研数据管理服务的各个阶段。

53%的人士表示偶尔要在发表论文和科研项目完成时被要求提交相应的科研数据资料,31%的人士表示经常要求提交相应的科研数据资料。调查显示,我国的科研数据管理和共享体系尚不完善,绝大部分国内科研资助机构未对科研人员在科研数据管理、保存、共享等方面作出相关规定。对于科研中产生的科研数据,大部分人认为应归属于科研机构和科研人员。

面对我国科研数据管理和共享机制不完善、科研人员缺乏科研数据管理方面的技能、各方共享责任不明确等问题,图书馆或第三方机构应开拓自身业务,承担起数据管理和共享职责,参与到数据管理、数据保存、数据咨询、数据分析处理等各个环节。

3 结论

3.1 科研人员数据获取方面存在多种困难,国内科研数据管理和共享政策应细化各方责任

2018年国务院出台了《科学数据管理办法》,在科研数据管理规范、保存、共享、安全等方面作出了规定[11]。可见,制定科研资助机构层面的科研数据管理和共享政策将成为我国科研资助机构的重要职责和迫切任务。该办法规定科学数据管理工作实行国家统筹、各部门与各地区分工负责的体制,但规定的内容并不详细。通过调研发现,目前我国大部分科研资助机构并未要求科研人员在申请项目时提交科研数据管理或共享等相关计划,导致政府资助的研究产生的科研数据大多分散在科研机构和科研人员手中,使得科研数据共享不足,科研人员获取科研数据较为困难。

因此,完善科研数据管理和共享机制具有重要性和紧迫性。我国应该从国家、科研资助机构和科研机构/企业三个层面补充和完善包括科研数据管理和共享等方方面面的政策规定,明确科研资助机构、科研单位和科研人员在科研数据管理和共享中的角色和职责,做到分工明确、职责清晰,以充分实现科研数据的价值。

3.2 大部分科研人员缺乏数据管理的专业技能和专业工具软件,造成数据管理混乱

大部分调查对象没有使用专门保存和管理科研数据的工具软件。没有有效的数据管理工具软件、不想花费较多的时间和精力管理数据、种种原因造成数据丢失是科研人员在管理和利用科研数据过程中遇到的主要困难,也有部分人士认为不知道索引或元数据的创建,或者忘记数据存储位置。而项目组在数据管理方面,多数是由多个项目组成员共同管理或项目负责人集中管理,少数由图书馆或所在机构统一保管。加上少有科研机构要求项目开始时建立科研数据管理计划,导致我国科研数据管理体系有待完善。这些都说明我国科研人员数据管理的水平与意识亟待加强。

针对现有现状,国家、科研管理机构和科研主体在制定和完善相关政策和机制时,应充分考虑科研人员可能面临的困难,为他们管理、利用和共享科研数据提供指导与帮助,必要时引入图书馆或第三方科研数据管理机构,解决科研数据管理和共享难题。科研机构、图书馆或第三方机构可通过系统的培训,如科研数据管理技能、有哪些软件可帮助实现数据管理、这些软件如何使用、数据存储技巧等,帮助科研人员增强数据管理方面的技能。

3.3 国内科研数据共享以私人关系流通为主,数据公开共享不充分

约80%的人士曾经以无偿或有偿的方式给他人提供科研数据,说明科研人员对科研数据共享有着广泛的需求。但调查数据显示,我国科研人员获取和共享科研数据的途径以私人关系流通为主,如从有合作关系的同行、研究团队成员、同事、同学或校友等处获取数据。这表明在我国科研数据共享机制不完善的情况下,数据开放程度、共享时间、共享方式等都有待明确规定。调查发现,互帮互助原则是科研人员愿意共享科研数据最主要的原因。

因此,在科研数据共享过程中明确数据的保密级别、完善数据共享过程中的利益平衡机制及引用机制,消除科研人员的担心和疑虑,对推动和促进科研数据共享是非常重要的[13]。为确保科研数据充分共享,从而最大化利用科研数据,在制定各层面科研数据管理和共享政策的同时,还应建立与其配套的支持和保障机制、考核和评价机制等,为科研数据的充分共享提供补充和保障措施,保障政策的顺利实施。

3.4 多数科研人员希望图书馆在科研数据管理中发挥一定作用

调查发现,被访人士最希望图书馆或所在机构提供的科研数据管理服务有:数据分析处理、数据查找与获取、数据管理、数据交流与共享、数据咨询、数据保存。可见,科研人员希望图书馆或所在机构能够参与到科研数据管理服务的整个生命周期。此外,科研管理中,有相当一部分人员存在数据丢失的情况,并且认为管理科研数据需要花费大量时间精力。因此图书馆员应结合数据库资源、软件资源和自身在数据管理方面的优势,为科研人员提供全面的科研数据管理服务,以解决科研人员在数据收集和获取方面的困难,避免数据丢失的困扰,减少科研人员在数据管理上花费的时间等。

在数据查找、获取和分析处理方面,由于图书馆本身在数据库、软件和工具方面的优势,应该培养学科和数据馆员,使其在数据分析处理、查找与获取方面拥有专业知识和经验,帮助科研人员快速而准确地获取相关数据,并通过相关软件和工具形成数据分析报告,节约科研人员在数据查找和处理方面的时间和精力;关于科研数据管理、保存和共享方面,图书馆应当承担起科研数据管理和共享的桥梁作用,搭建机构知识库等媒介,使科研人员在项目完成后,将科研数据集中保存在机构知识库等媒介中,实现共享通畅性。此外,图书馆还应承担起教育培训方面的工作,定期到企业和科研机构中开展数据管理方面的培训,或者提供在线课程,如数据管理软件、数据库的使用方法和技巧,数据查找方面的方法和经验分享等,培养科研人员的数据管理知识,以更好地促进科研数据的管理与共享。

猜你喜欢
数据管理科研人员机构
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
企业级BOM数据管理概要
科研人员揭示油桃果实表皮不长毛的奥秘
定制化汽车制造的数据管理分析
科研人员破译黑猪肉特征风味物质
航发叶片工艺文件数据管理技术研究
企业科研人员激励问题及对策研究
数据挖掘在学生成绩数据管理中的应用研究
数据挖掘在学生成绩数据管理中的应用研究
一周机构净增(减)仓股前20名