基于用户画像的数字图书馆个性化信息服务研究

2021-11-24 08:18曹晓雅
科学与生活 2021年18期
关键词:用户画像数字图书馆个性化

摘要:数字图书馆在发展过程中,信息的载量越来越大,服务模式难以创新。现存的个性化信息服务存在多种弊端。用户画像通过分析用户的行为偏好,为精准推荐做参考。本文基于用户的画像视角,通过分析构建过程,提出了一种数字图书馆个性化信息服务研究的新思路。

关键词:用户画像;个性化;数字图书馆

1背景

当今,数字化、开放化、互联化的信息环境愈演愈烈,人类社会进入了数据富足供给的时代,数据资源已不再是稀缺资源[1]。“互联网+”时代的到来促使高校数字图书馆所处的社会环境和技术环境出现较大改变,数字图书馆的服务内涵由信息搜索和信息浏览拓展为行为策略指出和信息共享,出现了新的服务模式包括嵌入式服务,全媒体服务,O2O服务,MOOCs服务,云阅读服务[2]。

随着用户对于信息的需求量增加,数字图书馆未来的发展趋势逐渐偏向于用户的个性化信息服务研究。数字图书馆的个性化信息服务大致包括自定义服务界面设定、符合个人需求的内容定制、个性化信息推送服务以及智能的信息检索定制等[3]。当前,个性化数字图书馆信息服务中存在技术问题和用户隐私问题以及图书馆员素质方面的问题,同时如何为用户推送符合他们要求的内容也成为研究的难题。用户画像的概念最早由交互设计之父艾伦·库珀(AlanCooper)提出。

他说,用户画像是真实用户的虚拟表示,基于一组真实数据的目标用户模型。自2011年起,互联网正式进入了大数据时代。网络社交文化的迅猛发展连带出庞大的线上用户数据,有了足够的数据基础,如何精准的服务于用户的问题也随之产生,对用户画像的研究热潮也開始兴起。本文通过分析用户画像以及数字图书馆个性化信息服务的研究现状,分析了用户画像具体的构建过程,并提出了其对于个性化信息服务的价值。

2领域研究进展

2.1用户画像研究现状

以CNKI数据库作为来源数据库,以“用户画像”为关键词进行检索,限定中文文献,不限定时间,检索到的文献数量为629,对检索到的文献进行可视化分析,如图1所示。从图中可以看出,对于用户画像的研究,在2010-2013年的热度较低;随着大数据时代的来临,2013年以后,国内众多学者对用户画像研究的热度逐步上升。通过对文献的细致梳理,目前国内学者对于用户画像的研究主要分为:(1)理论层面的探讨;(2)用户画像模型构建方法;(3)用户画像的应用。

2.1.1理论层面研究现状

用户画像的概念最初应用于电子商务领域。在大数据时代,用户信息泛滥。如图2所示,每个用户的特定信息都被抽象到标签中,这些标签用于具体化用户的形象,以便为用户提供有针对性的服务。国内学者对于用户画像的定义有不同的理解。余孟杰对于用户画像的定义更加偏向于用户角色,指出在产品研发时需要这样一个角色来进行讨论,通过“用户信息标签化”把抽象化的数据具体为虚拟人物[4]。徐恩,於志文,杜贺和郭斌认为用户画像是基于一系列数据的模型[5]。刘海,卢慧,阮金花,田丙强,胡守忠等认为用户画像是消费者基本信息和消费记录所构成的数据集合[6]。黎小林等基于商品营销的角度认为用户画像是指通过收集与分析用户的相关数字化数据踪迹,如页面点击历史、商品交易记录、用户反馈数据等,将用户所有的标签综合起来,勾勒出该用户的整体特征与轮廓[7]。

2.1.2模型构建的研究现状

陈泽宇和黄勃提出了基于主题词改进的词向量模型来构建用户画像,相比于只利用目标单词的词向量,用主题词向量将代表这个主题下单词的整体语义,更好的表达了用户的特征[8]。张壮,冯小年和钱铁云提出一种基于多模态融合的用户画像模型用于解决用户画像建模中各模态不能深入交互的问题[9]。蒋明会,苗夺谦,罗晟,赵才荣等基于粒计算思想,本文以用户在搜索引擎的历史搜索记录和用户属性(年龄、性别、学历)为原始数据,使用Stacking模型融合技术对多种模型进行融合以改进单一模型、单一粒度学习的限制,实现了多粒度的用户画像[10]。徐恩,於志文,杜贺,郭斌等基于手机感知数据从年龄、性别和人格特征三方面来构建用户画像.然后,使用随机森林分类模型识别性别,并利用SVR来识别人格特征.由此提出了一种基于多维感知数据的用户画像模型[11]。

2.1.3在图书馆领域应用的现状

王雪峰通过基于用户画像的相关理论,对智慧图书馆的群体进行划分,从而对不同用户的行为需求进行深层次的挖掘,并分析每一类用户群体的典型特征,实现了用户画像的精准刻画。从而对群体用户的行为进行可视化呈现[12]。徐海玲等基于概念格构建了高校图书馆群体用户兴趣画像,揭示不同群体用户的行为需求,挖掘潜在的行为规律,为高校图书馆不同群体用户的个性化服务提供参考[13]。李丹等在图书馆广泛的读者行为框架中定位用户与应用系统的互动需求,探讨可以更好地在读者与INNOPAC等应用系统的互动关系中发挥良好作用的推荐方式[14]。过仕明通过用户画像和场景五力等相关理论,构建了数字图书馆用户画像,揭示了不同群体用户的行为需求,并对其场景进行了重构,为数字图书馆更好发展提供了服务和参考[15]。

王雪峰基于超级IP和用户画像的理论,清晰明了的揭示了不同群体用户的特征,对群体用户的行为进行可视化呈现,并基于用户的行为提供更加符合特征的场景,从而进一步提升智慧图书馆的服务能力[12]。

2.2数字图书馆个性化信息服务

胡英义总结了互联网环境下高校图书馆提供信息服务的必要性和紧迫性,并提出改变提供信息服务的方式和方法[16]。在过去的十年中,徐远峰提出了通过现代信息技术提高图书馆信息服务水平并窃听信息技术潜力''的想法[17]。刘素清等根据新媒体的特点,提出了数字图书馆信息服务的新方向,分析了新媒体时代用户对决策信息的个性化需求[18]。基于数据挖掘技术,安贝提出了大学数字图书馆的信息服务优化策略,并优化了大学数字图书馆的信息服务策略[19]。

3基于用户画像的个性化服务策略研究

3.1数据来源和构建方法

数据的收集面向全体师生,包括本科生,硕士生,博士生以及教师。数据的来源是图书馆后台记录的数据,主要是借书的记录数据以及用户的静态属性即性别、年龄、专业、年级、职称等如图3。通过构建不同群体的借阅偏好,构建用户画像,为用户提供个性化服务。根据数据来源的不同,目前对用户画像的构建方法主要分为两种:基于人文学科范畴的研究方向和基于计算机、数据统计等范畴的研究方向。图书馆个性化信息服务的用户画像属于人文学科范畴的研究方向。

3.2构建步骤与个性化服务

将采集到的数据进行数据清理,构建标签体系后进行聚类,然后进行可视化的呈现。半结构化和非结构化数据主要是在各种系统模块中生成的行为数据,例如书目归还系统中的数据恢复,电子阅读管理系统中的数据输入,Internet接口上的数据和数据库操作数据等。由于数据生成的形式不同,标准和规范不同,数据的存储方式和格式具有一定程度的排他性,因此较为复杂。基于集成系统和统一的管理数据,收集各种类型的数据并完成数据清除操作更加方便和可操作[20]。

用户画像的本质是完成对用户标签的描述,即对用户进行标签。在人为干预的前提下,放置一个用于标记用户肖像的系统,可以对数据挖掘过程中创建的数据进行排序并消除其偏差,并归纳和制定标签的特定特征的标识。建立用户标签系统的具体过程主要包括:获取有关用户数据的信息,提取信息要点,将其与典型的,具有代表性的参考词表进行比较,形成用户需要的标签对应的词表。

聚类分析是一种根据事物的特征对个体进行分类的方法,将数据分为具有较大外部差异但内部相似度较高的几类,目前,聚类分析研究领域主要涉及处理过程,模型识别和市场分析。K-均值算法和C-模糊工具的聚类算法(FCM算法)是目前使用最广泛的两种分类方法。聚类后可以根据不同群体即本科生、硕士生、博士生以及教师的不同的行为偏好构建用户画像[21]。

建立用户画像可为读者的个性化服务打下良好基础。用户数据的来源和格式决定了推荐策略,推荐内容及其呈现形式,并直接影响用户对推荐内容的关注和接受程度。在数字图书馆的个性化信息服务的过程中,通过分析用户的来源来构建和预测用户画像的具体模型。然后根据用户可能需要的信息进行深入的数据挖掘,完成对信息资源的推送服务。

4结语

数字图书馆的服务模式正在发生改变,随着大数据技术的成熟发展,多种创新模式层出不穷。个性化信息服务作为数字图书馆未来的发展趋势,对它的深入研究有十分重要的意义。用户画像的概念多应用于互联网营销领域,将其借鉴于图书馆的个性化服务能够促进数字图书馆的发展,更好的服务于读者。

参考文献

[1]朝乐门.信息资源管理理论的继承与创新:大数据与数据科学视角[J].中国图书馆学报,2019(02):26-42.

[2]郑美玉.“互联网+”时代高校数字图书馆服务模式创新研究[J].情报理论与实践,2016,39(7):36-40.

[3]赵天昀.数字图书馆个性化信息服务中用户隐私保护研究[J].图书馆理论与实践,2018(2):101-103.

[4]余孟杰.产品研发中用户画像的数据模建——从具象到抽象[J].设计艺术研究,2014(6):60-64.

[5]徐恩,於志文,杜贺,郭斌.基于移动感知数据的用户画像系统[J].郑州大学学报:理学版,2019,51(4):30-36.

[6]刘海,卢慧,阮金花,田丙强,胡守忠.基于“用户画像”挖掘的精准营销细分模型研究[J].丝绸,2015,52(12):37-42.

[7]黎小林,徐苏,王海忠.在线平台用户画像对品牌依恋的影响[J].广东财经大学学报,2019(5):38-49.

[8]陈泽宇,黄勃.改进词向量模型的用户画像研究[J].计算机工程与应用,2020,56(1):180-184.

[9]张壮,冯小年,钱铁云.基于多模态融合技术的用户画像方法[J].北京大学学报:自然科学版,2020,56(1):105-111.

[10]蒋明会,苗夺谦,罗晟,赵才荣.基于粒计算的多粒度用户画像[J].模式识别与人工智能,2019,32(8):691-698.

[11]徐恩,於志文,杜贺,郭斌.基于移动感知数据的用户画像系统[J].郑州大学学报:理学版,2019,51(4):30-36.

[12]王雪峰.智慧图书馆知识服务场景构建研究——以吉林艺术学院图书馆为例[J].情报科学,2019,37(12):98-104.

[13]徐海玲,张海涛,张枭慧,魏明珠.基于概念格的高校图书馆群体用户兴趣画像研究[J].情报科学,2019,37(9):153-158.

[14]李丹,高建忠.基于用户画像的图书馆推荐服务初探[J].图书馆,2019(7): 66-71.

[15]过仕明.数字图书馆用户画像及场景重构研究[J].情报科学,2019,37 (12):11-18.

[16]胡迎义.高校图书馆个性化信息服务研究[J].兰台内外,2018(12):38- 40.

[17]续远凤.近十年我国图书馆信息服务研究综述[J].图书馆界,2016(6):35 -39.

[18]刘素清,彭妍,惠中艳,等.面向决策支持的高校图书馆信息服务[J].中国中医药图书情报杂志,2019,43(2):38-41.

[19]安蓓.基于数据挖掘技术的高校图书馆信息服务优化策略[J].信息记录材料,2019,20(4):198-199.

[20]潘宇光.高校智慧圖书馆读者信息需求的用户画像[J].合肥工业大学学报(社会科学版),2018,32(2):113-119.

[21]谭浩,郭雅婷.基于大数据的用户画像构建方法与运用[J].包装工程,2019,40(22):95-101.

作者简介

曹晓雅(1997—),女,汉,山东泰安,硕士,北京联合大学,研究方向:数字图书馆。

猜你喜欢
用户画像数字图书馆个性化
为小学英语个性化合作学习单做加法
把声音的魅力发挥到极致
移动用户画像构建研究
基于云计算的数字图书馆建设与服务模式研究
基于微博的大数据用户画像与精准营销
刍议数字图书馆计算机网络的安全技术及其防护策略
移动互联网下手机用户使用行为特征的研究
同桌宝贝
校本课程开发的个性化问题探讨
呼唤雕塑家创作的个性化