[发明专利]一种基于用户兴趣模型的个性化摘要系统无效
申请号: | 200810224285.1 | 申请日: | 2008-10-16 |
公开(公告)号: | CN101373486A | 公开(公告)日: | 2009-02-25 |
发明(设计)人: | 刘永利;欧阳元新;袁满;熊璋 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京永创新实专利事务所 | 代理人: | 赵文利 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 兴趣 模型 个性化 摘要 系统 | ||
1.一种基于用户兴趣模型的个性化摘要系统,该个性化摘要系统由Web信息检索单元、用户兴趣单元和个性化摘要单元组成;其特征在于:
所述Web信息检索单元根据查询请求负责完成对Web页面的索引和检索任务,并将检索结果WR输出给个性化摘要单元、将检索日志WLOG输出给用户兴趣单元;
所述用户兴趣单元根据Web信息检索单元提供的检索日志WLOG,利用概念聚类法建立以层次概念结构描述的用户兴趣模型IC,所述用户兴趣模型IC为用户在通过Web信息检索单元进行检索时,所访问的Web页面对象的并集;表达形式为IC={p1,p2,p3,......,pM},其中,p表示Web页面对象,M表示Web页面的数量;
所述个性化摘要单元(A)根据用户兴趣单元提供的用户兴趣模型IC与Web信息检索单元输出的检索结果WR进行用户兴趣与检索结果中句子相似度的解析,获得相似度I(s),I(s)=max(I(c1,s),I(c2,s),……,I(cn,s))输出给个性化句子评分处理;
I(s)=max(I(c1,s),I(c2,s),……,I(cn,s))中,c表示概念,s表示一个句子,n表示用户兴趣的概念个数;
(B)利用检索结果WR计算出句子中的查询关键词的逆文本频率IDF,然后依据逆文本频率IDF计算每一个句子s的分值Sidf(s),并将分值Sidf(s)输出给个性化句子评分处理;
(C)利用检索结果WR计算出每一个句子s中的信息量Sic(s),并将信息量Sic(s)输出给个性化句子评分处理;
(D)个性化句子评分处理依据最终评分对每一个句子s进行重要性排序,并将排序结果中前K项组成一个个性化摘要输出给用户,从而完成在用户模型下的个性化摘要的订制;
其中,最终评分中的α表示分值Sidf(s)的系数,β表示信息量Sic(s)的系数,γ表示相似度I(s)的系数。
2.根据权利要求1所述的基于用户兴趣模型的个性化摘要系统,其特征在于:用户兴趣模型中的每个概念c用一组关键词及其权重的二元组表示为c={(t1,W1),(t2,W2)……,(tm,Wm)},t表示关键词,W表示关键词的权重,m表示概念c所包含的关键词个数。
3.根据权利要求1所述的基于用户兴趣模型的个性化摘要系统,其特征在于:在个性化摘要单元中,所述分值中IDFt表示出现在句子s中的查询关键词t的倒排词频,tq表示查询q中的关键词组成的集合,Sidf(s)反映了句子包含查询关键词的多少。
4.根据权利要求1所述的基于用户兴趣模型的个性化摘要系统,其特征在于:在个性化摘要单元中,所述信息量中Weightt表示TF*IDF算法计算
得到的关键词t的权重,ts表示句子s中的关键词组成的集合,f表示一个句子长度调节系数;Sic(s)反映了句子所包含信息的多少,在生成摘要的过程中作为Sidf(s)的辅助因素。
5.根据权利要求1所述的基于用户兴趣模型的个性化摘要系统,其特征在于:排序结果中前K项中K的取值为排序结果中的前2~5句句子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810224285.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:测量水温的温度传感器
- 下一篇:一种小推车止动装置