[发明专利]基于本体的用户模型构建方法在审

专利信息
申请号: 201710117737.5 申请日: 2017-03-01
公开(公告)号: CN107016566A 公开(公告)日: 2017-08-04
发明(设计)人: 王国军;唐凯;张强;邢萧飞 申请(专利权)人: 广州大学
主分类号: G06Q30/02 分类号: G06Q30/02;G06Q50/14
代理公司: 广州三环专利商标代理有限公司44202 代理人: 郝传鑫
地址: 510000 广东省广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 本体 用户 模型 构建 方法
【说明书】:

技术领域

发明涉及旅游领域的建模方法,更具体地说,涉及一种基于本体的用户模型构建方法。

背景技术

旅游业是一个集中了交通、游览、住宿、餐饮、购物、文娱等环节的综合性产业。随着网络技术的飞速发展,人们在网络上可获取的旅游信息呈现出一种爆炸式的增长态势,这些网络信息资源在给人们带来丰富知识和极大便利的同时,也会给个人造成了信息疲劳和信息压力。为了快速准确地定位到需要的旅游信息,给人们个性化地推送信息,对用户兴趣模型的研究已经成为当下的热点与难点。目前,已经出现了一些常见的用户模型构建方式:基于关键词的、基于向量空间模型的、神经网络的、评价矩阵的等,但是这些用户模型都存在一定的缺陷。基于向量空间的方式稳定性较差,结果常常有许多偏差;基于神经网络的方法则不易理解,适用范围较小;基于评价矩阵的适应能力差,很难做到对兴趣更新;因此,这些模型不能准确的描述用户的个人兴趣。

由于本体在用户兴趣描述上具有一定的优势,逐渐被很多学者研究。研究方向包括:(1)如何利用本体形式化描述用户的认识结构,为用户构建基于领域本体的用户模型,提高个性化检索的质量;(2)基于用户知识本体和概念向量构建用户模型,实现用户兴趣的个性化语义描述;(3)构建集成用户兴趣信息和语义信息的加权本体,并基于该加权本体提出了一个个性化语义搜索框架; (4)通过用户个性本体、校正本体和本体更新实现用户模型的构建,在以上研究中,领域知识只是一个领域分类体系,用户兴趣对每个概念主题的兴趣仍采用了加权关键词的描述形式;(5)用本体抽取Web社区用户会话的类、属性和实例作为特征项,基于特征项出现频度、在领域本体中语义位置及兴趣模型更新算法计算特征项权重;(6)将本体表示为节点和边组成的概念层次,每个节点与代表其内容的文档集相关联,通过tf-idf法计算文档集权重生成节点向量,通过索引项预先算出所有向量;(7)三元组表示法:本体概念的描述、兴趣度及最近一次更新时间;(8)提出四元组表示法:用户属性集、领域本体、领域本体中概念集及用户对各概念的访问量、用户间关系集;(9)提出六元组表示法:用户个性化信息(兴趣模型标识)、用户兴趣本体概念集、用户兴趣度集、概念集中成对概念语义相似度、概念创建时间、概念所含项目最近一次被访问时间。

但是,在用户兴趣模型的学习和更新的过程中对于资源仍采用了关键词向量的描述形式。虽然应用了领域知识,但是基本的技术仍然是基于关键词的描述方式和传统的机器学习算法的应用,而且所建立的用户模型大多数只是一个概念层次结构,用户模型是静态的,不能随着用户兴趣的变化而动态及时更新,用户模型的稳定性较低。用户模型不能随着用户兴趣的变化(含内容变化、旧兴趣衰减、新兴趣生成)而及时地经行适应性的改善,从而不能很好的反映兴趣变化的过程。

发明内容

针对现有技术的缺点,本发明的目的在于提供一种基于本体的用户模型构建方法,能更好地给资源进行定位,改善旅游信息检索性能。

为了实现上述目的,本发明的技术方案为:一种基于本体的用户模型构建方法,包括如下步骤:(1)获取能够反映用户特征、偏好和需求的相关信息;(2) 构建旅游领域本体;(3)利用相似度算法对用户进行分类;(4)对每一个用户构建模型,利用本体来表示用户模型;(5)利用兴趣度传递调整的方式对用户模型进行更新。

作为本发明的一种改进,在步骤(1)中,所述信息的获取方式包括显式采集和隐式采集,显式采集通过用户的注册信息,直接收集用户的基本信息;隐式采集通过分析用户web使用日志记录,获取用户的基本信息inf、用户对叶子节点的偏好程度v以及访问本体概念层次树中叶子节点的访问量V,其中,用户的偏好程度如式(a)所示,访问量如式(b)所示:

V=vi(1<=i<=n)表示用户对第i个叶子节点感兴趣的程度,fi,r表示用户访问叶子节点Li的人资源的次数,n表示本体概念层次树中叶子节点的个数,根据叶子节点的访问量计算非叶子节点的访问量,使用户的偏好信息补充完整。

作为本发明的一种改进,在步骤(2)中,构建旅游领域本体的过程包括:建立文件、建立类及其类层次、建立属性及属性的允许值、添加实例。

作为本发明的一种改进,步骤(3)中,所述相似度算法的公式为:

sim(i,j)=w×rij/es(i,j)+(1-w)×S(i,j) 0<w<1

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710117737.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top