数字赋能视角下人文研究者信息查寻行为影响因素研究

2024-03-19 13:17孙绍伟
图书馆 2024年2期
关键词:研究者受访者人文

孙绍伟

(中山大学信息管理学院 广州 510006)

0 引言

随着人工智能、大数据、区块链、虚拟技术、5G 技术等新兴数字技术不断融入学术研究全过程,数字证据和方法的使用、数字创作、数字出版、数字内容管理和保存以及对学术成果的使用和重用[1-2]成为数字学术环境下的“新常态”,也促进了传统人文学科学术视野和研究范式的数据驱动转型。面对新科技革命和产业革命的时代要求,人文学科与数字科技的交叉与融合成为新时代我国“新文科”创新发展[3-4]与数字人文发展的新路径[5]。尽管人文研究者对数字资源的疑虑和抵触正随着基础设施的日趋完善而发生转变[6-9],开始更多地使用数字资源[10-11],并认可数字化历史报纸[12-13]、数字档案[14]等原始文献的数字替代品的价值,但是,一些研究也发现人文研究者面临着数字观念转变困难、数字技术使用障碍等挑战[15],对数字学术的介入后果抱有种种担忧[16],尤其是文学、历史学、语言学、哲学等传统人文学科研究者的数字能力居于弱势[17-18]——人文研究者在数字浪潮下产生了失能感,难以实现数字转型。

数字赋能(Digital Empowerment)是指通过大数据、移动互联和人工智能等数字技术与工具为特定人群赋能,使其获得相应的生活技能和生存能力[19]。该理论关注数字技术环境对社会的改变,并强调利用技术手段助力弱势群体跨越数字鸿沟等社会分化问题,其核心在于使“失能者”获得改变现状的能力、意愿和权力[20]。作为一个多维度概念,Kabeer 认为赋能涉及资源、能动性和成就三个维度[21];也有研究指出赋能包括资源赋能、结构赋能、心理赋能、领导赋能等维度[22-23]。由于其问题意识和对“失能者”的人文关怀与数字时代的图书馆信息学(Library and Information Science,LIS)有着天然关联,近年来数字赋能成为LIS 学科的一个重要研究主题[24]。

探索特定群体信息查寻行为的特征及规律是LIS 领域理解该群体与数字技术互动的一个常见切入点和路径。对于本研究所关注的人文研究者群体而言,学术信息查寻行为特征一方面关系到数字学术基础设施构建、数字学术服务等实践领域;另一方面,LIS 如何赋能人文研究者以实现数字转型,关乎“新文科”建设、数字人文发展等国家战略需求。因此,本研究旨在探索数字学术环境下人文研究者学术信息查寻行为的影响因素,并引入数字赋能理论来探讨人文研究者如何融入数字时代的问题。

1 研究设计

1.1 访谈提纲

本研究采用半结构化访谈法。访谈大纲由五部分构成:①人口统计特征及其研究经验。②学术信息的信息源偏好。了解人文研究者在教学和科研场景下使用学术信息资源的类型及来源。③学术信息的使用和认知。调查人文研究者使用学术信息的资源类型、使用频率和情境,了解数字资源和纸质资源在其研究工作中的比重及其对数字学术信息的感知和看法。④信息查寻过程及影响因素。要求受访者以自身研究方向/课题为例,详细描述其信息查寻的思路与过程,包括使用的资源、工具和策略,了解其信息查寻过程中的影响因素。⑤信息查寻面临的障碍和应对措施。访谈主要围绕访谈大纲展开,但同时会根据受访者的回答进行追问。

1.2 数据搜集

受疫情影响,本研究通过在线访谈招募了12 名受访者。访谈主要分为两个阶段:第一阶段,招募2 名人文研究者分别进行文字和电话试访谈,根据其反馈内容来修订访谈提纲,并将试访谈的资料纳入后续分析。第二阶段,再招募10 名受访者使用修改后的访谈大纲进行正式访谈。

正式访谈采用一对一形式进行。笔者首先介绍本次研究的目的和内容,并就访谈录音问题征求受访者同意,对访谈资料隐私保护问题进行说明。正式访谈时间为2021年4月到8月,12 名受访者基本特征见表1 所示。正式访谈共获得415 分钟的音频资料,人均访谈时长为41.5 分钟。最后将访谈音频转录成文字并校对,12 个样本共得到文本数据10.83 万字。

表1 受访者基本特征

1.3 编码过程与结果

本研究采用扎根理论(Grounded Theory)的三级编码方式[25],借助质性数据分析工具Nvivo11 进行数据编码和分析。为保证数据收集和分析的统一性,笔者完成了访谈、转录和初始编码的全过程。为持续调整数据收集方向,编码与访谈同步进行。当编码到第10 个样本时,基本无新标签出现,笔者利用剩下的2 份样本进行验证,亦未出现新的标签,说明编码内容已达到理论饱和。其后,笔者以咨询方式邀请两位学者对主题编码进行逐一审读和讨论,以保证对原始资料概念抽取的科学性。三级编码过程如下:

开放式编码。如表2 所示,为了更直观地揭示概念之间的关系,本研究采用“分子式标签”对原始语句赋予本土概念,得到了81 个初始标签(a1—a81),通过归纳和合并,共得到26 个基本范畴(A1—A26)。开放式编码涉及大量原始材料内容分析,囿于篇幅,表3 仅例举部分编码过程。

表2 开放式编码结果表

表3 部分开放式编码过程

主轴编码。本研究对26 个基本范畴进行了聚类与整合,提炼出基础设施、情境因素、成本—收益、信息质量、能力感知5 个主范畴(见表3)。

选择性编码。本研究的核心范畴是“数字学术环境下人文研究者信息查寻行为”。如表4 所示,笔者通过对5个主范畴的持续比较,梳理出如下“故事线”:①在不同情境下,人文研究者的信息查寻需求、信息源选择、信息检索思路与策略等行为有不同的表现形式。②基础设施、成本—收益对数字学术环境下人文研究者的信息查寻行为产生直接影响。③信息质量通过成本—收益的中介作用影响人文研究者的信息获取、采纳等行为。④用户的能力感知调节着成本—收益与人文研究者信息查寻行为之间的关系强度和方向(见图1)。

图1 人文研究者信息查寻行为影响因素模型

表4 主范畴的典型关系结构表

2 研究结果

2.1 基础设施

学术基础设施是人文研究者信息查寻的客观条件,从根本上决定了人文研究者信息查寻的载体选择、查寻方式以及结果。基础设施体现在软件硬件、信息资源、数据库建设、文献购置、访问权限等五个基本范畴。

信息资源(A2)和数据库建设(A3)是人文研究者信息查寻行为的首要影响因素,其信息源选择、载体偏好等受到资源有无、资源多寡的制约。例如,受访者#2 认为“历史学科是比较传统的学科,纸质资源很丰富”,因而其偏好学科资源更为丰富的纸质文献。但后续访谈中,#2 也提到“明显发现近几年来数据库上新的很多”,因此该受访者对数字资源利用也在逐渐增多。类似地,受访者#1 也提出从“以往偏爱纸质文献”向“越来越发现数字资源的便利性”的转变。因此,学术信息资源数字化建设的日趋成熟是人文研究者信息查寻数字转向的根本原因。

人文研究者所在机构的文献保障能力最终会影响其学术信息的获取。例如,有受访者表示“国外的一些SSCI 的一些top journal,那么你只有通过它的RSS 功能获取到它最新的一些动态。你想得到纸质版的,我们的学校没有订阅,因此我们都是以电子的为主”。本研究发现部分院校在经费、资源等方面存在不足,导致其纸质馆藏难以满足人文研究者的学术信息需求,使人文研究者的注意力转向了数字资源。例如,受访者#12 表示:“像我们这种小图书馆,可能明显你的文献收藏量不能跟大的图书馆比,很多文献其实是没有的。那我只能够去用数字化的这些东西。”同时,所在机构数据库订购内容不丰富,也会促使人文研究者产生学术信息求助行为,通过人际关系或公共图书馆、档案馆获取所需信息。

此外,大多数人文研究者强调访问权限是制约其获取数字学术资源的重要因素。一方面,有受访者(#1)认为很多公共图书馆的数字资源“只开放题录信息,不能获取全文”,自己访问和获取数字学术文献受到较大限制。另一方面,也有受访者(#12)描绘了数字资源因版权问题而下架的遭遇,提到“上学期开始应该说下架了非常多。之前,其实查的很多(文献)可以传递的,甚至可以全文看的,那么现在可能连这个书都找不到了”,认为数据库中的文献可能面临版权因素等引起的下架风险,影响自己获取数字学术信息。也有受访者(#2)直言“史料查寻最关键就是开放程度问题”。

2.2 情境因素

个体的信息查寻行为总是发生在特定情境中[37-39],本研究提炼出人文研究者学术信息查寻的学科情境、任务情境、研究方向和研究阶段四个基本范畴。

首先,各个学科的研究范式和特征决定了人文研究者文献需求类型的差异,进而影响到学术信息查寻全过程,包括信息资源类型、信息源选择(#1、#6、#12)、信息检索思路与策略(#10)、信息检索工具的选择(#1、#6)、信息载体的偏好与选择(#2)等。个人研究者的具体研究方向或研究主题也对其信息资源类型、信息源选择产生直接影响。例如,受访者#6 的研究对象为国外散文作家及文体,因此高度依赖外文文献、外文数据库。

其次,人文学者的文献信息需求受教学和科研任务影响,驱动其开始学术信息查寻。在面临备课、申报课题、实施项目、撰写论文等教学与科研任务时,或者在对某一问题不清楚或不熟悉的情况下,人文研究者会主动使用数据库等查找和持续跟踪所需信息。

最后,研究阶段也对人文研究者的学术信息查寻行为产生影响。受访者普遍认为在开展一项研究工作的前期、中期和后期,其信息查寻的需求、思路和侧重点会从关注全面性向更具针对性的方向变化。例如,受访者#12 描述到:“我在申报项目前,我肯定是先了解一下大家现在研究的一个情况……但是我就不一定会具体到某一个读书会,我就不需要具体到青年读书会的创办人、它的发展的历史,某一点去细查。那么在进行当中……我就会具体到这些具体的点上去,这应该说是更加细致的过程。”此外,受访者(#12)表示随着研究的不断深入,其也会在关键词选择、检索式构造以及检索方式方法上做出调整。研究工作进行到后期,人文研究者普遍认为对“相关信息源和工具也越来越熟悉”(#1),自身检索方法亦可能得到优化(#6),检索效率也随之提高(#1)。

2.3 成本—收益

2.3.1 感知成本

人文研究者在数字时代的学术信息查寻行为受到感知成本的制约,而感知成本由经济成本和非经济成本构成。首先,经济成本是影响个体信息获取渠道、信息载体渠道选择的重要因素。人文学科图书、古籍以及相关“大部头”工具书价格昂贵,个体难以负担,因此,一些受访者认为获取数字资源是更经济的方式(#9、#10),也有受访者选择先获取数字文献再将之转化为纸质文献的方式(#10)。而非经济成本则包括:①获取难度。受访者一方面强调便利性对其载体选择、信息源选择的影响;另一方面强调获取难度也会影响其学术信息求助行为,如“非正式出版物的获取比较难,有时候还需要通过老师、朋友、图书馆员的帮助,会私下获取一些”(#1)。②程序成本,获取文献的程序复杂、烦琐程度会促使人文研究者对信息获取渠道做出选择和调整。例如,受访者#4 描述其跨地区借阅学术文献的经历:“我进去可能就是要手续,你可能需要复印或者说怎么样。拿出来、借出来也很麻烦。借了这个书我还得去还,也是比较麻烦。”③认知成本,主要体现在当新的检索平台、工具和技能较难掌握时,人文研究者可能倾向于拒绝付出心理努力而采取消极查寻方式,如保持现状或回避学习。④时间成本,人文研究者信息查寻的各个要素,包括检索工具、检索策略、载体选择、持续查寻信息乃至信息使用等,均受时间因素的制约。多位受访者强调了数字资源在节省信息查寻时间方面的重要性。

2.3.2 信息需求

信息需求在相当程度上反映了人文研究者的感知收益,人文研究者对特定文献的需求程度决定了其愿意投入的时间、精力和经济等成本的高低。当信息需求程度较高时,人文研究者愿意投入各种经济和非经济成本,并尝试采取多种方式获取所需信息;如果需求程度较低,人文学者表示会停止信息查寻而“只能凑合用”(#6)。此外,有受访者认为所在机构的资源与服务已经足以满足其学术文献需求,因此对于他人提供的新的信息源没有了解和学习的意愿(#5);同样地,部分人文研究者现有的方式足以满足其信息需求,因此对数字工具的需求程度较低,不愿意投入时间、精力、认知等成本去提升数字工具使用技能。

2.4 信息质量

信息质量是影响人文学者信息筛选、获取和采纳行为的主要因素。在信息获取和采纳阶段,人文学者的关注重心会从其他方面聚焦到学术信息的有用性,与自身研究主题的相关性,信息的权威性、准确性、及时性等维度。

首先,信息与研究的有用性和相关性是人文研究者决定是否采纳某一检索结果的首要因素。几乎所有受访者均提到“是否符合我的一个方向,是否符合我这个专业,或者说是否符合我最近想要研究的或者说了解的一些东西”(#9)是他们在信息筛选乃至是否进一步获取全文的首要考量。其次,大多数受访者认为信息的权威性是影响信息筛选和采纳的重要因素。在“知识爆炸”或“信息爆炸”(#7)的困境中,人文研究者往往没有余力获取并阅读所有检索到的学术文献,故信息的权威性成为对检索结果进一步筛选的指标,通常的参考点包括:是否是专业核心期刊(#3、#4 等)、文献被引数或下载量(#3、#5 等)以及作者是否为领域权威(#7)等。最后,信息的及时性也是人文学者关注学术前沿、查寻学术信息时考虑的因素,多位受访者表示习惯将检索结果按照“年份排序,先看最新的”(#4、#11)。同时,也有受访者认为图书或者专著出版的时滞性较高,因此倾向于使用数据库查阅期刊论文而不是查阅纸质文献(#5、#7、#9)。此外,历史学、汉语言文学等学科的受访者提出,这些学科涉及大量史料的甄别与校对,因此十分重视学术信息的真实性和准确性(#2、#10、#12),对于有争议的信息他们都抱有十分谨慎的态度。

除了上述信息在内容层面的特征,信息在组织层面的可获取性也会影响人文研究者的信息查寻行为。首先,信息组织得清晰直观与否直接影响人文研究者对所需学术信息的浏览、发现。例如,受访者#3 提出一些政府公开报告“是隐性的,它不会很明显地显示出来”。其次,信息的跨平台分散也制约了人文学者信息查寻的效率和效果,因此也有受访者提到了对学术信息聚合性组织的需求(#9)。而信息的可获取性则是人文学者从线索、题录或者摘要到实质上获取文献内容的关键一步,而实践中信息的可获取性也是人文学者学术信息查寻普遍面临的制约因素。

2.5 能力感知

人文研究者自身的能力感知对其信息查寻行为和查寻结果具有调节作用。而能力感知不仅体现在以信息检索为核心的数字能力(A25)维度,也体现在人文研究者的学科、领域知识结构(A26)层面。

受访者认为数字能力越强的人越能查寻到所需的学术信息,体现在对信息检索方式、方法、工具等方面更熟悉(如#6、#9),信息检索策略更多样,关键词选择和检索式构造更合适,检索效率更高等方面。也有受访者描述,自身信息检索能力较差,时常面临着“有时候想查……我明明觉得心里很清楚,但是我连查都不知道该用什么办法去查,连关键词都想不出来”(#10)的失能困境,或者其他人的信息检索能力明显高于自己的落差(#5、#11)。有两位受访者都在访谈中提到“搜商”这一概念,认为“搜商”不仅能让个体“处理信息的速度越来越快”,还能提高“信息占有”量,倘若两个人的“搜商”不一样,那么“他们找到的信息肯定是不一样的”(#7)。

人文研究者自身的学科、研究领域知识结构同样对其信息查寻过程和结果存在显著影响,这正是上文所述的信息检索会随着研究的深入更具针对性、准确性的原因之一。本研究还发现人文研究者自身的学科知识结构与其数字能力紧密关联,专业知识的专深程度首先影响其关键词选择或者检索式构造。部分研究者认为诸如语言学、历史学、文学等人文学科对研究者的知识广度和深度均具有较高要求,例如,受访者#10 表示“我觉得问题的根源,就在于作为学生,学识确实感觉不够丰富。因为做训诂,它要的知识面实在是太广了”,因此该受访者表示在信息查寻过程中会遭遇“连关键词都想不出来”的窘境。而受访者#12也从自身经验出发,认为选定恰当的关键词在信息查寻过程中至关重要,“(关键词)如果不恰当的话,那么查出来的东西可能会影响比较大”。此外,受访者#5 认为人文研究者在筛选信息查寻结果时,也会受到自身知识背景或者个人偏好的影响,“即使我们在选择文献的时候,可能也会带着个人的偏好去选择”。而专业知识结构除了对关键词选择、信息筛选与采纳具有影响外,还包括对学术文献的阅读(#11)。

3 研究者信息查寻的数字赋能

笔者研究发现,数字学术环境对人文研究者信息查寻行为的数字赋能体现在资源赋能和行动者赋能两方面。其中,资源赋能是指数字学术基础设施构成了人文研究者数字转向的先决条件,它是个体能动性得以发挥从而有效选择的物质基础。行动者赋能是指人文研究者不断增强的能动性,包含心理赋能和素养赋能两个维度,前者指向个体的主观意愿、动机和意义,后者指向个体的知识、技能。

3.1 资源赋能:数字学术基础设施是人文研究者数字转向的先决条件

Kabeer 的赋能三维框架认为资源是赋能的先决条件。本研究也发现数字学术基础设施的迭代与发展增强了人文研究者有效选择的能力,是推动人文研究者数字转向最基础、最根本的原因。人文学科具有高度的“文献依赖型”特征,随着数字基础设施的日益成熟,尤其是人文研究者所依赖的“软性基础设施”[40]的快速发展,本研究中的受访者反复强调的古籍资料、档案、地方文献、特色文献等文献资源数字化建设(A2),面向人文学科的特色数据库建设(A3),科研机构的数字文献保障(A4)等都获得了极大发展。此外,数字资源内容揭示粒度、关联性及数字人文工具的发展亦提升了人文研究者深入探索数字对象的可能性。

同时,本研究还发现了人文研究者对开放学术的呼吁和迫切需求。几乎所有受访者都强调了访问权限、开放程度等对其学术信息查寻的制约,认为人文研究学术信息获取“最关键的是开放程度问题”。事实上,推进开放学术是学术图书馆数字学术服务的战略方向之一,已频繁出现在世界一流大学图书馆的战略规划中[41]。学术图书馆等相关实践者要将“开放学术”纳入面向人文学科的学术基础设施建设范畴,以最大程度地保障人文研究者的学术资源获取。

3.2 心理赋能:人文研究者学术信息查寻的理性导向

心理赋能强调内在任务动机的强化过程,是个体对自身工作环境的一系列认知状态,包含影响力、能力、意义及选择四项认知要素,反映了个体对自身努力、表现与结果预期、结果效价(outcome valence)等因素的权衡[42]。笔者研究发现,数字学术环境下人文研究者面临着更为复杂的学科、研究方向、任务和研究阶段等,而获取教学和研究工作所需的学术信息资源是人文研究者的首要目标。为了使自己获得有利的查寻结果,人文研究者的行为意向主要受理性因素的驱动。本研究所提取的基础设施、成本—收益、信息质量三个主范畴均为理性层面的因素,强化了当前人文研究者的理性影响因素,并为其学术信息查寻行为提供了内在动机。具体而言:①基础设施是学术信息查寻的客观条件,资源有无、多寡的结果预期直接决定了人文研究者采取何种查寻方式、工具、载体等。②成本—收益认知反映了个体努力与结果预期的对比,直接影响人文研究者对信息查寻的经济、时间、精力、心智努力的投入。尤其是在面临信息查寻障碍时,成本—收益认知会影响人文研究者进一步的信息查寻行为。③信息质量则反映了个体对结果效价的认知,通过成本—收益认知影响人文研究者的信息筛选、获取和采纳行为。

3.3 素养赋能:数字能力培育与学术水平提升的协同发展

本研究发现部分人文研究者确实面临着“数字失能”的困境。受访者在教学、科研中长期面临学术信息源选择、检索式制定、数字信息筛选、数字信息获取等方面的困惑与迷茫。笔者先前在一些调查中已发现以文学、历史、哲学、语言学等学科为代表的传统人文研究者的数字能力相对弱势。人文研究者的数字能力并不符合《提升全民数字素养与技能行动纲要》[43]中提出的全民数字化适应力、胜任力、创造力显著提升,以及到2035年基本建成数字人才强国的发展目标,也与“新文科”建设等国家战略的人才需求并不匹配。因此,本研究揭示了数字浪潮下人文研究者素养赋能的急迫性与必要性。

同时,本研究揭示了数字学术环境下人文研究者的数字能力、领域知识结构。人文学科知识具有较强的累积性,个体专业领域的知识储备对其学术信息查寻能力具有正向影响。但是,当前人文学科的课程体系较少涉及数字技术模块,在培养人文研究者的过程中数字技术要素是缺位的。因此,本研究认为数字能力培育模块应被嵌入青年人文研究者的学术训练体系中,以促进人文研究者数字能力和领域知识结构的协同发展。

4 结语

本研究采用扎根理论定性分析方法对12 名人文研究者进行了访谈,通过对访谈资料的分析和三级编码,构建了数字学术环境下人文研究者信息查寻行为的影响因素模型。同时,引入数字赋能理论批判性审视人文研究者数字转型议题,归纳出数字学术环境对人文研究者学术信息查寻行为的资源赋能、心理赋能和素养赋能三维面向。本研究对LIS 学科参与并引导针对人文学科和人文研究者的数字学术基础设施建设、数字学术服务、人文研究者数字赋能等具有理论和实践意义。

但研究也存在以下不足。首先,尽管本研究已经达到理论饱和,但研究样本以青年学者为主,囿于作者的研究条件和研究能力,未能在研究中纳入特征更加多元化的研究样本。其次,文章提炼出的影响因素的路径关系及强度,也有待后续研究结合结构方程模型等定量方法进一步予以验证。

(来稿时间:2023年7月)

猜你喜欢
研究者受访者人文
人文
今天,你休闲了吗?
关于安全,需要注意的几件小事
低碳生活从我做起
五成受访者认为自己未养成好的阅读习惯
高等教育中的学生成为研究者及其启示
研究者称,经CRISPR技术编辑过的双胞胎已出生。科学将如何回应?
研究者调查数据统计
人文绍兴
人文社科