[发明专利]一种基于用户兴趣模型的个性化摘要系统无效

专利信息
申请号: 200810224285.1 申请日: 2008-10-16
公开(公告)号: CN101373486A 公开(公告)日: 2009-02-25
发明(设计)人: 刘永利;欧阳元新;袁满;熊璋 申请(专利权)人: 北京航空航天大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京永创新实专利事务所 代理人: 赵文利
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 用户 兴趣 模型 个性化 摘要 系统
【说明书】:

技术领域

发明涉及Internet中的信息检索方法,更特别地说,是指一种通过分析用户检索日志,利用概念聚类方法建立和/或更新以层次概念结构描述的用户兴趣模型的个性化摘要系统。

背景技术

搜索引擎是目前人们在使用互联网资源时的重要工具,用户根据自己的检索意图提交查询,然后得到大量的检索结果。用户不可能阅读每个结果的所有内容,因此检索结果往往以摘要的形式给出以供用户选择自己感兴趣的内容。

传统方式的摘要采用偏重摘要(query-biased summary)的形式。偏重摘要是根据用户的查询需求而生成的存在侧重点的摘要。由于偏重摘要通常仅根据查询条件生成,而查询条件往往不能准确表达用户的查询意图;另一方面,偏重摘要内容不考虑用户的兴趣差异,只要查询内容相同,摘要内容就相同,难以满足不同用户的需求。因此在Web信息检索系统中用偏重摘要表达文档内容的方式亟待改善。

发明内容

本发明的目的是提供一种基于用户兴趣模型的个性化摘要系统,该系统通过分析用户检索日志,利用概念聚类方法建立和/或更新以层次概念结构描述的用户兴趣模型;然后依据该用户兴趣模型与检索结果进行用户兴趣与检索结果中句子相似度的解析,从而得到满足用户的个性化摘要。该系统的个性化摘要在偏重摘要的基础上,充分考虑了用户的兴趣特点。

本发明是一种基于用户兴趣模型的个性化摘要系统,该个性化摘要系统由Web信息检索单元、用户兴趣单元和个性化摘要单元组成;

所述Web信息检索单元根据查询请求负责完成对Web页面的索引和检索任务,并将检索结果WR输出给个性化摘要单元、检索日志WLOG输出给用户兴趣单元;

所述用户兴趣单元根据Web信息检索单元提供的检索日志WLOG,利用概念聚类法建立以层次概念结构描述的用户兴趣模型IC,所述用户兴趣模型IC为用户在通过Web信息检索单元进行检索时,所访问的Web页面对象的并集;表达形式为IC={p1,p2,p3,……,pM};

所述个性化摘要单元(A)根据用户兴趣单元提供的用户兴趣模型IC与Web信息检索单元输出的检索结果WR进行用户兴趣与检索结果中句子相似度的解析,获得相似度I(s)=max(I(c1,s),I(c2,s),……,I(cn,s))输出给个性化句子评分处理;

在此步骤中,用户兴趣与检索结果中句子相似度的解析采用向量空间模型中的cosine公式计算得到

(B)利用检索结果WR计算出句子中的查询关键词的逆文本频率IDF,然后依据逆文本频率IDF计算每一个句子s的分值Sidf(s),并将分值Sidf(s)输出给个性化句子评分处理;

在此步骤中,分值中IDFt表示出现在句子s中的查询关键词t的倒排词频,tq表示查询q中的关键词组成的集合。Sidf(s)反映了句子包含查询关键词的多少,能表达与查询之间的紧密关系。

(C)利用检索结果WR计算出每一个句子s中的信息量Sic(s),并将信息量Sic(s)输出给个性化句子评分处理;

在此步骤中,信息量中Weightt表示TF*IDF算法计算得到的关键词t的权重,ts表示句子s中的关键词组成的集合,f表示一个句子长度调节系数;Sic(s)反映了句子所包含信息的多少,更贴近句子的主题,在生成摘要的过程中作为Sidf(s)的辅助因素。

(D)个性化句子评分处理依据最终评分对每一个句子s进行重要性排序,并将排序结果中前K项组成一个个性化摘要输出给用户,从而完成在用户模型下的个性化摘要的订制。

所述的基于用户兴趣模型的个性化摘要系统,其用户兴趣模型中的每个概念c用一组关键词及其权重的二元组表示为c={(t1,W1),(t2,W2)……,(tm,Wm)},t表示关键词,W表示关键词的权重,m表示概念c所包含的关键词个数。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810224285.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top