谈谈本体基于本体用户模型在数字图书馆个性化服务中运用

更新时间:2024-02-03 作者:用户投稿原创标记本站原创
〔摘 要〕用户模型是数字图书馆个性化系统中的关键技术,传统的用户模型没有考虑词与词之间的内在联系,本文提出了一种基于本体的用户模型,该模型基于建立的兴趣分类本体,借鉴了检索领域常使用的激活模型来完成用户模型的更新,并在用户模型的基础上,设计了个性化服务推荐流程。
〔关键词〕个性化;兴趣分类本体;用户模型;本体
〔〕B 〔文章编号〕1008-0821(2012)09-0080-04
个性化信息服务是数字图书馆的发展方向,数字图书馆个性化服务针对不同的用户提供不同的信息服务,以满足他们不同的需要。数字图书馆个性化服务的实现过程是通过对用户信息需要、兴趣爱好和访问历史的收集分析,建立一定的用户模型,并将此模型应用于网上信息的过滤和排序,因此用户需求的获取和用户建模是实现个性化服务的关键因素。由于用户兴趣不断变化的,反映用户兴趣的需求模型也要动态变化源于:论文参考文献格式www.808so.com
,但目前用户的兴趣多以关键词表达的,个性化服务也是基于关键词匹配的,并没有理解用户兴趣的语义含义。本体的概念源于西方哲学,从哲学的范畴来说,本体是客观存在的一个系统的解释。目前,本体已经成为语义Web的核心内容,将本体应用于个性化用户建模可以较好的解决理解用户兴趣语义这一问题。
1 本体的相关理论
本体的概念被引入到人工智能领域和计算机领域,其目的是克服计算机系统之间存在的“语义鸿沟”。目前,本体已经成为语义Web的核心内容,也是语义Web的语义基础。
一个本体[3]可以由类或概念、关系、函数、公理、实例等5种元素组成。根据数字图书馆个性化的情况,将本体分成3类[4]:
(1)领域本体:描述特定领域中概念与概念之间的关系。
(2)任务本体:描述特定任务或行为中概念与概念之间的关系。
(3)应用本体:描述的依赖于特定领域和任务的概念及概念之间的关系。
2 数字图书馆个性化服务的内涵
数字图书馆个性化服务是一种满足用户个体信息需求的服务方式,目前数字图书馆的个性化服务主要是通过个性化检索和个性化推荐的方式实现的,数字图书馆个性化推荐系统是从海量数据中向用户自动推荐出符合其兴趣爱好或需求的资源,如中国知网(CNKI)知识网络服务平台(KNS)将读者相似文献的链接及推荐文献阅读服务,数字图书馆个性化服务的一般思路是:根据用户的个性化需求,建立用户模型,根据用户模型对用户进行过滤,将用户可能感兴趣的文献自动推荐给用户,再根据用户对推荐内容的反馈,对用户模型进行修正,再进行下一轮的推荐。
3 基于本体用户模型的设计
个性化服务系统首先获取用户的兴趣偏好信息,建立起用户的兴趣模型,采用本体描述用户兴趣时,把用户的兴趣以层次结构来描述,从而为用户提供更加全面的推荐。
基于本体的个性化用户模型主要包括用户行为的收集、用户兴趣的抽取、用户兴趣的更新、兴趣模型的表示以及个性化兴趣本题库这几个部分,如图1所示。
图1 基于本体的个性化用户兴趣模型
基于本体的用户模型由3个部分组成[5]:用户、个性化领域本体、个性化信息需求,用一个三元组表示为:User Model=(Persona,Person0,PersonR),式中Persona表示用户的,即用户的姓名、性别、年龄、学历、专业背景等,Person0表示用户信息的个性化领域本体,PersonR表示用户的个性化需求。
3.1 用户兴趣本体的表示
在实际中,每个人都有兴趣、爱好,体现在浏览数字图书馆信息内容方面,虽然每个用户都有不同的信息需求,但是一定的知识背景、工作性质决定了用户会有相当稳定的兴趣和信息需求,为了区分用户的兴趣类别,本文参照中图法建立起数字图书的分类本体,是一个只含类及其子类的树状结构,上层父类是对下层子类共同属性的概括,而下层子类是对上层父类的细化,所有子节点之间形成平等的兄弟关系,分类层次越细,描述用户的兴趣类别就越具体,图2是生物本体部分结构图,用户的兴趣本体映射来自此本体,一般是此本体的子集。该本体主要用于分类,其中只含有Subclass Of关系,没有其他属性。
用户的兴趣本体是兴趣分类本体的部分映射,用户的兴趣本体只映射到兴趣类别的那一层,例如一个用户的感兴趣图书的类别是{运输经济、中美关系、食品卫生},那么该用户的兴趣本体就是如图3这种形式:3.2 基于本体的用户兴趣度的获取
要获取用户感兴趣的图书,就有必要分析用户的访问日志,数字图书馆网站服务器真实记录了用户访问网站的所有日志,其中不仅记录用户的基本信息,而且记录了用户访问的路径,反应页面的关系,数据挖掘从这些日志中挖掘出用户行为有用的模式,兴趣度是用户对某一网站感兴趣的程度,数字图书馆可以根据用户的兴趣度进行个性化服务,从文献[3]可知,通过访问网站的时间和频度来计算用户的兴趣度是一种有效的定量计算的方法,主要表现在用户如果对某一网页感兴趣,则必然浏览该网页的时间更长和会经常重复浏览该网页,使用F=(n/N+t/T)l/L[6]公式来定量计算用户的兴趣度,其中n为访问该节点的次数,N为本次的访问次数,t为访问本节点消耗的时间,T为访问网站的总时间,l为本次访问的节点数,L为网站的总节点数,从Web日志中可以计算出用户的兴趣度,以江苏广播电视大学超星数字图书馆为例来计算用户的兴趣度,数据来源于江苏广播电视大学超星数字图书馆 2011年3月22日的一段日志:
2010 12-31 05∶54∶28 220.177.9.112-210.28.216.236 80 GET/09/diskRKF/RKF27/04/000073.pdg SSDOWNLOAD/3.8.0.0002+unRegister日志各段数据的含义为:
①访问时间——2011-03-22 05∶54∶28
②用户IP地址——220.177.9.112③服务器地址和端口——210.28.216.236 80
④用户请求信息的方法——GET
⑤用户访问的节点——/09/diskRKF/RKF27/04/000073.pdg
⑥以未注册用户的身份下载——SSDOWNLOAD/3.8.0.0002+unRegister
以IP为116.54.82.62的用户在2010年12月31日访问江苏广播电视大学超星数字图书馆的日志为例,进行数据格式化处理,如表1。
江苏广播电视超星图书馆共有22个总节点数,由表1可以得出,此用户的兴趣度为:
文学=(3/5+39/61)3/22=0.17
经济=(2/5+22/61)2/22=0.07
3.3 基于本体的用户模型的更新
本文借鉴文献[7]中用户模型更新的思想,采用激活扩散模型对用户描述的兴趣度进行更新,激活扩散模型是搜索关联网络、神经网络、语义网络的一种方法。
激活扩散算法如下:
输入:含兴趣值的本体化用户描述
输出:含更新的激活的本体化用户描述
其具体表示为:
For each Cj∈CON do
IS(Cj)=IS(Cj)+Cj.Activation;
End
CON={C1,C2,…,Cn}∥用户给予兴趣值的概念,如本文中C1为文学,C2为经济。
IS(Cj)∥表示概念Cj的兴趣值,如本文中文学的兴趣值为0.17,经济的兴趣值为0.07
Cj.Activation∥激活值
Cj.Activation=IS(Cj)*sim(di,Cj)
sim(di,Cj)∥用余弦相似度度量书名向量di与概念Cj的相似值。
4 基于本体用户模型的实现
本模块主要用于用户的兴趣表示以及用户模型的更新功能。
4.1 图书信息分类本体的建立
为了实现该模型,首先建立图书信息分类,通过参考中图法分类,使用protege3.4.8建立一个含有图书类别的概念,作为实验的本体,图4是经济类图书部分分类的层次结构,分类本体起着重要的作用,表现在:
(1)分类本体映射到用户的兴趣本体。
(2)分类本体辅助完成用户模型的更新。
4.2 用户兴趣的获取
当建立分类本体后,可以根据每个用户的兴趣构建兴趣本体,在数字图书个性化服务中,采用用户注册的方法来获取用户初始化兴趣。用户注册时,除了注册用户的一些基本信息外,还要选择用户的兴趣类型。
4.3 用户兴趣的更新
在数字图书个性化服务中,用户只需要完成一次注册,当其兴趣发生变化时,不需要用户手工兴趣类型,采用激活扩散模型完成用户兴趣的更新。这样,可以根据用户的浏览爱好对兴趣模型进行更新。
5 基于本体用户模型的个性化服务推荐流程
个性化服务的目的是从海量数据中向用户自动推荐出符合其兴趣爱好的资源,个性化推荐服务的主动方是系统平台,自动向用户进行推荐,基于本体用户模型的个性化推荐服务的流程如图5,其过程如下[8]:
(1)用户注册登录进入个性化服务系统,在注册过程中,除了注册基本信息,还要进行个性化,形成初始的用户模型。
(2)用户在浏览数字图书馆时,形成的浏览访问日志,对日志分析后与初始的用户模型迭加,形成该用户的基于本体的用户模型。
(3)系统推荐的用户潜在的需求的服务被推送到个性化推荐服务,用户进行浏览。用户对服务推荐结果的浏览行为也被系统用于更新用户模型。
6 结 语
数字图书馆资源的迅速发展,面对海量的资源,为了帮助用户找到其感兴趣的信息,个性化服务成了研究的热点。用户模型作为用户兴趣的可计算描述,已经成为个性化服务研究的重点。在传统的基于向量的用户模型中,各关键字互不相关,导致语义信息的缺失。本文使用分类本体得到用户的兴趣本体,可以改善传统用户模型语义不足的缺陷。
参考文献
罗宇红.数字图书馆个性化信息服务实践研究[J].图书馆论坛,2010,(8):75-77.
潘家武.基于领域本体的数字图书馆动态用户兴趣模型的构建[J].图书情报工作,2010,(8):64-67.
[3]邓志鸿,唐世渭,张铭等.Ontology研究综述[J].北京大学学报:自然科学版,2002,(5):730-738.
[4]肖敏.领域本体的构建方法的研究[J].情报杂志,2006,(2):70-74.
[5]熊回香,陈姗,许颖颖.基于Web 3.0的个性化信息聚合技术研究[J].情报理论与实践,2011,(8):95摘自:毕业论文范文www.808so.com
-99.
[6]郭家义.数字图书馆个性化服务信息行为的收集与分析[J].图书馆杂志,2003,(1):25-27.
[7]Ahu Sieg,Bamshad Mobasher,Robin Burke,Web search personalization with ontological user profiles[C].Proceedings of the sixteenth ACM conference on Conference on information and knowledge management,November 06-10,2007.
[8]曾春,邢春晓,周立柱.个性化服务技术综述[J].软件学报,2002,(10):1952-1961.
(本文责任编辑:孙国雷)

点赞:16005 浏览:63134