[发明专利]基于用户兴趣的个性化元搜索引擎及搜索结果处理方法无效
| 申请号: | 200910020951.4 | 申请日: | 2009-01-16 |
| 公开(公告)号: | CN101477554A | 公开(公告)日: | 2009-07-08 |
| 发明(设计)人: | 杜晨光;颜涛;邓双成;李晓辉 | 申请(专利权)人: | 西安电子科技大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 陕西电子工业专利中心 | 代理人: | 王品华;黎汉华 |
| 地址: | 71007*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 用户 兴趣 个性化 搜索引擎 搜索 结果 处理 方法 | ||
1.一种基于用户兴趣的个性化元搜索引擎,主要由用户注册/登录单元、元搜索结果收集单元和个性化处理单元组成,其特征在于个性化处理单元,包括:
搜索结果预处理模块,用于接收元搜索结果收集单元送入的搜索结果原始数据,进行基于网址和基于摘要内容的去除重复处理,并将处理后的搜索结果送入个性化排序处理模块;
个性化排序处理模块,用于接收搜索结果预处理模块送入的搜索结果数据,并进行基于用户兴趣和搜索意图的个性化排序处理,将排序后的搜索结果提交给用户;
用户兴趣更新模块,用于捕获用户对搜索结果的点击行为,对用户点击过的搜索结果进行兴趣分析,并对用户兴趣数据库中存储的用户兴趣模型数据进行更新;
用户兴趣数据库,用于存储网站注册用户的兴趣模型数据,并将这些数据提供给个性化排序处理模块进行个性化排序。
2.一种基于用户兴趣的个性化元搜索引擎结果处理方法,包括:
步骤1.建立并初始化用户兴趣模型数据,保存在服务器的用户兴趣数据库中;
步骤2.将用户输入的搜索词语,按各独立搜索引擎要求的格式分发出去,并收集它们返回的结果,将收集的返回结果转换成统一的格式;
步骤3.将转换成统一格式的搜索结果进行去除重复处理;
步骤4.根据用户兴趣模型和本次搜索词语对去除重复处理后的搜索结果进行个性化排序,并将该排序结果提交给用户;
步骤5.捕获用户点击的搜索结果,对其进行兴趣分析,改变兴趣种类和权值大小,并根据改变的结果更新用户兴趣数据库中用户的兴趣模型数据。
3.根据权利要求2所述的基于用户兴趣的个性化元搜索引擎结果处理方法,其中步骤1所述的建立用户兴趣模型数据,包括两种方式:一是用户直接通过主动选择网站提供的兴趣类别并设置权值大小,建立该用户的用户兴趣模型数据;二是搜索引擎系统通过兴趣更新模块对用户搜索行为的兴趣分析,自动建立用户兴趣模型数据。
4.根据权利要求2或3所述的基于用户兴趣的个性化元搜索引擎结果处理方法,其中所述的用户兴趣模型数据,用I(C)={(c1,w1),(c2,w2),...,(cm,wm)}表示,其中(ci,wi)是用户的一个兴趣分量,ci为兴趣类别,wi为ci对应的归一化权值,该用户兴趣模型数据是用于定量描述用户兴趣喜好及其喜好程度的数据集。
5.根据权利要求2所述的基于用户兴趣的个性化元搜索引擎结果处理方法,其中步骤3所述的将转换成统一格式的搜索结果进行去除重复处理,是先将统一格式的搜索结果按照网址是否相同进行过滤,只保留网址不同的搜索结果;再将各条搜索结果的摘要内容与其它搜索结果的摘要内容进行文本比较,滤除摘要内容相似的搜索结果。
6.根据权利要求2所述的基于用户兴趣的个性化元搜索引擎结果处理方法,其中步骤4所述的根据用户兴趣模型和本次搜索词语对去除重复处理后的搜索结果的个性化排序方法,按如下步骤进行:
(6a)分别计算搜索词语与用户兴趣的相关度向量和搜索结果与用户兴趣的相关度向量;
(6b)根据步骤(6a)得到的相关度向量,计算搜索结果与用户搜索词语的相关度向量;
(6c)计算搜索结果在各独立搜索引擎上的排名得分向量;
(6d)将步骤(6b)和(6c)得到的数值进行加权综合,得到每条搜索结果基于用户兴趣的权值,并按权值大小排序,得到个性化排序结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910020951.4/1.html,转载请声明来源钻瓜专利网。





