网络学习系统个性化实时推荐策略研究

2016-01-26 05:42卢志翔

重庆科技学院学报（自然科学版） 2015年3期

关键词：个性化推荐

卢志翔

(南宁学院信息工程学院，南宁 530200)

网络学习系统个性化实时推荐策略研究

卢志翔

(南宁学院信息工程学院，南宁 530200)

摘要：网络学习资源海量化在给学习用户提供资源选择多样化和学习自主化的同时，也给用户快速获取个性资源提出了更高要求。在分析当前个性化推荐技术的基础上，充分考虑学习的过程性和资源间的语义相关性，提出一种基于本体个性化的实时推荐模型和算法。主要从模型构建、本体构建、语义相关度和个性推荐算法等方面进行研究，设计了网络学习系统中资源个性化推荐的基本框架和流程，为提高网络学习效率提供全新的解决思路。

关键词：个性化推荐；实时推荐；推荐策略

网络技术的快速发展，网络教学资源的海量化、多样化，影响着传统的教学模式和学习模式，为个性化学习需求提供了良好基础。同时教育政策也提倡构建网络化教学体系，逐步实现个性化学习和移动学习[1]。《教育信息化十年发展规划(2011 — 2020年)》指出：个性化学习已成为信息时代教育发展的重要特征。2012年全国教育信息化工作电视电话会议上，国务院副总理刘延东在会上明确提出5年内构建网络化的教学体系，使学生学习方式由被动式向个性化学习、移动学习、泛在学习发展。

要实现网络学习的个性化，既需要大量的学习资源满足不同用户的需要，更需要为不同用户在海量资源中快速获取适合自己学习的资源提供便捷，这是网络学习系统中个性化推荐存在的急需解决的问题。因此，对网络学习系统个性化实时推荐进行研究是十分必要的。

1个性化推荐研究现状

个性化推荐研究是20世纪90年代由Resnick[2]首次提出，主要应用于新闻协同过滤推荐研究。个性化推荐是根据用户的兴趣特点、个人信息、操作行为以及社会关系等信息，并分析用户偏好，建立用户模型，最终向用户主动推荐用户感兴趣的信息。目前电子商务、新闻、娱乐等网络系统中个性化推荐技术使用较为普遍，如淘宝商城、Amazon等都采用了个性化推荐技术，实时推荐相似的商品供用户选择，促进用户购买商品从而达到营销目的。目前使用的推荐技术主要有基于内容过滤的推荐技术[2-3]、基于协同过滤的推荐技术[4]、基于关联规则的推荐技术[5-7]和基于本体的推荐技术[8]。

1.1基于内容过滤的推荐技术

基于内容过滤的个性化推荐技术主要思想是根据用户以往的浏览习惯和浏览内容，提取用户的兴趣特征构建用户兴趣模型。通过匹配资源属性特征和用户兴趣的相似性来过滤信息，最后排序资源并推荐给用户。基于内容的个性化推荐系统一般通过加权方式计算用户兴趣特征权重，对于兴趣单一的老用户推荐的信息较为精确。国外著名的基于内容过滤的推荐技术研究有麻省理工大学开发的个性化浏览辅助智能体Letizia[9]。

1.2基于协同过滤的推荐技术

协同过滤推荐是在电子商务系统中应用最成熟的技术之一，其核心是采用最近邻居技术(TOP-N推荐)，基本思想认为人与人之间的行为存在某种程度的相似性，也就是2个用户，具有相同的浏览历史，新浏览的资源可能相同。协同过滤就是根据目标用户的兴趣模型匹配其他不同用户，计算出相似程度，再根据相似度最高的最近邻用户或用户群的兴趣资源，推荐给当前用户。基于内容过滤的推荐技术是根据用户以往的兴趣进行同类或相似资源推荐，而协同过滤技术是根据其他用户的喜好产生推荐，前者推荐的资源是同类，后者推荐的资源是同类用户的兴趣资源，与资源内容本身无关。常见 “最新10条新闻”、“点击率最高10条新闻”是协同过滤推荐典型案例。国外基于协同过滤推荐技术研究的有斯坦福大学提出的基于内容的协同推荐原型系统FAB[10]。

1.3基于关联规则的推荐技术

关联规则挖掘是数据挖掘领域中广泛研究的挖掘技术，最早由Hammond等人提出并应用于推荐系统[5]。关联规则技术根据当前用户的兴趣信息，通过大量数据分析，分析数据中项集之间有趣的关联或相互关系，按照规则的重要程度把信息排序展现给用户。关联规则推荐技术最大特点是可以离线模式下产生推荐模型，能满足实时推荐的要求。

1.4基于本体的推荐技术

基于本体的推荐技术通过获取用户知识体系，根据不同的知识领域规则向用户推荐相关知识，推荐的精确度主要依赖本体的知识表示。从哲学角度来说，本体(Ontology)指客观存在的一个系统解释。20世纪90年代本体概念引入人工智能来表示知识，定义为概念模型的明确规范说明，为人工智能下的本体提供一种可共享、可重用的知识描述方式。目前基于本体的个性化推荐研究有CNKI相似资源推荐功能，清华大学推出的混合推荐系统Open Bookmark等[11]。

从目前推荐技术(特别是电子商务信息个性化推荐)研究来看，个性化推荐已有了一定的发展。但这些技术应用于网络学习、资源个性化推荐却突显出很多不足：

(1)忽视学习的过程性。学习不同于网络购物，它属于一个完整的学习认知过程，包括学习课程内容、学习活动、学习评价以及测试考试等各种活动。基于内容过滤推荐、协同过滤推荐、关联推荐等，只考虑资源相似或关联，并没有考虑学习活动状态及学习效果。当用户在线测试效果不佳时，推荐的资源应能考虑到用户认知水平。

(2)忽视资源间的语义相关性。目前很多推荐系统都能做到相似资源的推荐，但忽略资源间的语义相关性，如语义包含、等价、上下位概念等。

本次研究提出的推荐模型，考虑学习的过程性和资源间的语义相关性，根据学习过程实时筛选推荐学习资源，从而保证推荐资源的质量。

2个性化实时推荐策略

2.1个性化推荐设计思想

目前成熟的个性推荐技术比较适合于电子商务系统。用户的兴趣爱好是不断发生变化的，课程学习是循序渐进的，如果只重视用户长期兴趣模型的建立，推荐的结果往往是偏向旧知识，新知识、上下关联的知识则得不到推荐。为提高目前网络学习系统个性化推荐的精准度，提高用户学习的效率，根据知识的认知规律，提出网络学习系统个性化实时推荐框架，模块体系结构如图1所示。

图1　网络学习系统个性化推荐模型

实现的主要模块有学习任务诊断模块、学习模块、测试与评价模块、数据挖掘模块和个性化推荐模块。

(1)学习任务诊断模块。用户登录后读取数据库中的学习任务记录，恢复上次任务学习状态。推荐的学习资源根据任务状态节点的资源及相关资源提供。

(2)学习模块。从学习任务模块或课程资源库中选取学习资源，用户访问资源的详细页，同时记录学习状态和进度。推荐模块根据用户即时学习状态，在线计算资源间的相关度，推荐与本次学习内容最相关的资源，包括知识点的上下位、概念以及测试资源库相关资源。

(3)测试与评价模块。该模块主要是课程配套的练习、相关测试资源的考试。该系统根据用户的答题情况作出相应的评价，记录学习者对学习效果的自我评价，并记录用户测试的状态和结果。评价结果体现用户对知识的认知和掌握程度，体现学习的质量，而学习质量影响到推荐结果的精确度。学习质量较高则推荐资源倾向于关联的新知识，学习质量较低则推荐的资源倾向于关联的旧知识。

(4)数据挖掘模块。该模块根据当前用户行为状态，从数据库中提取用户学习记录信息，根据本体中定义的语义相关为用户在课程资源库中查询相关资源并建立用户模型，为个性化推荐模块提供兴趣集。本模块分为离线数据挖掘和在线实时数据挖掘。各资源语义间的相关度通过离线计算，主要是提高系统的计算效率。实时推荐度通过在线实时计算，确保推荐的资源是目前学习状态最相关的资源。

(5)个性化推荐模块。推荐模块根据数据挖掘模块分析产生的数据集进行实时计算，并根据用户的学习状态实时筛选数据并排序，生成个性推荐结果集，从而完成个性化实时推荐。

从图1可以看到，先记录用户的学习行为，再根据相关数据挖掘方法进行兴趣特征提取，产生用户兴趣数据集，最后结合用户学习现状得到推荐结果，推荐过程运用到文本特征提取技术、机器学习技术等。

2.2个性化推荐策略

目前常用的推荐技术主要有基于内容过滤的推荐技术、基于协同过滤的推荐技术和基于关联规则的推荐技术，这3种推荐技术对语义信息的理解较差，难以满足用户对知识的需求。本次研究提出的个性化推荐系统考虑整个学习流程，为提供高效的个性化学习服务，技术上选择基于本体的推荐技术，考虑学习资源间的语义相关性，实时监控用户学习状态并对资源推荐候选集进行筛选，保证推荐资源的质量和效率。其中主要涉及的关键技术有本体构建、语义相关度以及个性推荐算法。

(1)本体构建。本体构建是在特定领域内对概念之间的关系进行形式化组织的过程。本体构建方法有手工构建和自动化构建，需要领域专家或学者遵循一定的规范和要求，才能准确、真实地反映现实世界。目前本体构建主要是手动构建，比较著名的本体构建方法是斯坦福大学开发的“七步法”[12]。具体步骤：确定领域本体范畴、考查复用已存在的本体、确定本体专业术语、定义类和类间层次体系、定义类属性、定义属性相关约束、创建类实例。本体已经成为世界所认可的知识表示手段。在实际构建中，我们需要构建两类本体：课程资源本体和用户知识本体。课程资源本体描述了各种学习资源之间的内在联系，并形成一定的层次结构，包括课程概念本体和其它学习材料本体。用户知识本体主要描述该用户的学习任务结构、学习偏好等知识。

(2)语义相关度。语义相关度主要是衡量知识概念之间关联的紧密程度，概念还很模糊，没有比较客观的标准可以衡量。目前中文语义相关度计算研究较少，很多都以相似度计算为研究扩展，普遍认为相似度越高相关度也越高。语义相关度常用计算方法大致分为2类:基于语义词典的语义相关度计算方法和基于大规模语料库的语义相关度计算方法。现有的语义资源有WordNet、知网、同义词词林、维基百科,百度百科、互动百科等。其中知网是最具研究代表性的中文语义词典资源。课程资源的本体结构是层次关系和上下位关系，所以笔者采用语义距离度量的方式计算语义相关度。在知网中语义的基本单位是义原，可以通过计算义原相关度和义原关联度来计算词语语义相关度。义原相关度(H)计算公式[13]为：

H(p1,p2)=β(d+β)

(1)

式中：p1,p2— 义原；

d— 义原距离；

β — 调节参数。

知网中词语(S)由多个义原描述，并将多个义原线性叠加得到词语的相关度。词语义原包含基本义原H1(S1,S2)、辅助义原H2(S1,S2)、关系义原H3(S1,S2)和符号义原H4(S1,S2)。则词语S1,S2的义原相关度为：

(2)

式中γi(1≤i≤4)为调节参数，且有γ1+γ2+γ3+γ4=1,γ1≥γ2≥γ3≥γ4，表明基本义原为义原主要特征描述，其他义原对词语整体的影响依次递减。

义原关联度(A)描述义原的上下位关系及层次关系，计算公式为：

(3)

式中D为横向关联深度，即义原向上第几层的解释影响；d(pi,pj)表示义原pi在pj中出现的向上数的层数。从式(3)可看出层次越高的父节点的解释义原对该义原的影响越小。

综上所述，词语W1,W2语义相关度记为R(W1,W2)，则计算公式为：

(4)

式中λ为调节参数，且λ1+λ2=1。

(3)个性推荐算法设计。本次研究的个性推荐算法推荐的准确度依赖本体的知识表示，而不是使用相似用户的兴趣作为推荐的主要依据。为提高系统的推荐效率，资源的语义相关度通过离线计算，为用户推荐资源时采用实时计算推荐度排序算法，确保推荐的资源与当前用户学习状态最相关。同时，系统对用户的学习行为进行更新，为下一次推荐作参考，起到更新推荐结果的作用。个性化推荐算法设计如图2所示。

图2　个性化推荐算法示意图

资源间的语义相关度通过离线计算，个性化推荐模块采用实时计算方案。在推荐资源的过程中，考虑用户以往学习的质量来提高推荐的精度。用户以往学习记录中只查看学习资源，还不做相关测试资源，这时应该推荐相关的测试资源给用户；如果用户以往学习记录中的测试记录值过低，则应推荐用户查看过的资源、同类资源及相关测试资源；如果用户以往学习记录中测试记录值较高，认为用户学习质量较高，根据知识认知过程和概念的上下位关系推荐新的资源给用户。在实际应用中我们引入κ(0≤κ≤1)表示学习质量，设定κ0、κ1为2个临界点。当κ<κ0时，提高Setemp(N,RS)中用户历史资源的语义相关度；当κ0<κ<κ1，提高Setemp(N,RS)中用户学习记录点的资源及相关测试资源的语义相关度；当κ1<κ，提高Setemp(N,RS)中用户未查看过资源的语义相关度。实时推荐算法伪代码如下所述。

输入：用户学习状态P；

输出：Top-N推荐资源集；

BEGIN

① 处理P，确定学习记录节点，提取节点资源N，处理N使之符合规范；

② N本体语义概念扩展；

③ 根据公式(4)，对P概念集与资源库RS求交集得Setemp(N,RS)；

④ 根据学习质量记录，对待推荐集Setemp(N,RS)中的语义相关度进行修正，得Setemp(N,RS)；

⑤ 根据语义相关度值对Setemp(N,RS)进行大小排序，提取Top-N条推荐资源集，完成推荐。

END

3结语

网络资源良好的呈现方式和推送策略是提高网络学习效率的有效途径。个性化实时推荐对网络自主学习的人性化、时效性起到了十分重要的作用。本次研究从学习的过程性和资源间语义相关性的角度，研究了个性化推荐模型。论述了网络学习系统中资源个性化推荐的基本框架和流程，为提高网络学习效率提供全新的解决思路。

参考文献

[1] Joachims T. Web Watcher: A Tour Guide for the World Wide Web[C]Proceedings of 15thInternational Joini Conference on Artificial Intelligence(IJCAI-97). Nogoya: [s.n.], 1997.

[2] Resnick P. Grouplens: An Open Architecture for Collaborative Filtering of NetNews[C]Proceedings of CSCW 94. Chaple Hill: NC, 1994:175-186.

[3] 王巧荣.个性化服务中的用户建模技术[J].小型微型计算机系统,2011,32(1):83-86.

[4] Hofmann T. Latent Semantic Models for Collaborative Filtering[J].ACM Transactions on Information Systems,2004,22(1):213-238.

[5] Fu X B, Budzik J, Hammond J K. Mining Navigation History for Recommendation[C]Proceedings of the 2000 International Conference on Intelligent User Interfaces. New York: ACM Press, 2000:106-112.

[6] 丁振国.基于关联规则的个性化推荐系统[J].计算机集成制造系统,2003,9(10):891-893.

[7] 李杰.面向个性化推荐的强关联规则挖掘[J].系统工程理论与实践,2009,29(8):144-152.

[8] 黄海江,杨贯中.基于本体的学习内容个性化推荐[J].科学技术与工程，2007,7(14):3394-3398.

[9] Henry L. Letizia an Agent that Assists Web Browsing[C]Proceedings of the International Joint Conference on Artificial Intelligence. Montreal: [s.n.],1995: 97-102.

[10] Balabanovi C M,Shoham Y. Fab: Content-Based,Collaborative Recommnendation[J]. Communications of the ACM, 1997, 40(3):66-72.

[11] 冯翱,刘斌,卢增祥,等.Open Bookmark：基于Agent的信息过滤系统[J].清华大学学报(自然科学版),2001(3):85-88.

[12] 李景,孟连生.构建知识本体方法体系的比较研究[J].现代图书情报技术,2004(7):17-22.

[13] 许云,樊孝忠,张锋.基于知网的语义相关度计算[J].北京理工大学学报,2005,25(5):411-414.

Research on the Real-time Recommending

Strategies for Personalized Online Study

LUZhixiang

(Information Engineering College of Nanning University, Nanning 530200, China)

Abstract:The unlimited resource online provide users with various options and initialed study, but it also requires users to speed up acquirement of personal resource. This article produces a real-time recommending model and computing based on the analysis of current personal recommend technologies as well as consideration of study progression and semantic relevance. The article also discussed model construction, learner construction, semantic relevance and computing and designed a framework and process for personalized recommending for optimum result to offer a solution promoting the efficiency of online study, in hope of contributing to the personalized online study research.

Key words:personalized recommendation; real-time recommendation; recommendation strategy

文献标识码：A

文章编号：1673-1980(2015)03-0080-05

中图分类号：TP311

作者简介：卢志翔(1980 — )，男，广西南宁人, 硕士，讲师，研究方向为计算机应用、智能算法。

基金项目：广西教育科学“十二五”规划2013年度课题(2013C121)；南宁学院2014年度科研项目(2014XJ06)

收稿日期：2014-12-02