[发明专利]基于用户点击行为的数字图书搜索方法无效

专利信息
申请号: 200810063010.4 申请日: 2008-07-04
公开(公告)号: CN101320375A 公开(公告)日: 2008-12-10
发明(设计)人: 吴江琴;庄越挺;袁川;张寅 申请(专利权)人: 浙江大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 杭州求是专利事务所有限公司 代理人: 张法高
地址: 310027*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 用户 点击 行为 数字 图书 搜索 方法
【说明书】:

技术领域

发明涉及数字图书馆、信息检索和Web使用挖掘领域,尤其涉及一种基于用户点击行为的数字图书搜索方法。

背景技术

21世纪是数字化的时代,随着计算机技术、海量存储技术和网络技术的飞速发展,信息载体的数字化和信息传播的网络化得到了空前的深化,图书馆的数字化成为一个必然趋势。数字图书馆在世界很多国家受到了高度关注,并取得了迅猛发展,已经成为人们获取信息与知识的重要途径。

数字图书馆中通常拥有海量的数字图书资源,如何有效的利用这些丰富而宝贵的资源,让数字图书馆读者能够更充分的利用他们就显得非常重要。数字图书搜索是数字图书馆必须提供的支撑性服务本,它是数字图书馆中最为重要的一个功能模块,它使得读者能够很好地找到需要的图书资源,是数字图书馆服务平台的“第一线”。

传统的图书资源搜索系统是基于关系数据库的简单匹配查找,只能过滤出与读者所输入的关键字相匹配的相关图书条目,并没有使用有效的图书排序机制以提高读者检索的满意度,而且性能和用户体验不佳。

发明内容

本发明为克服数字图书馆中传统图书搜索系统质量差的缺点,提供了一种高质量的图书搜索结果排序方法。

基于用户点击行为的数字图书搜索方法包括以下步骤:

(1)提取日志中的图书阅读记录构建图书之间的关联图,使用关联图计算图书的相关性排序得分;

(2)提取日志中的检索阅读记录,利用读者对检索结果的隐式反馈对查询词进行聚类;

(3)抓取互联网上的图书评分数据,整合形成图书评分排序得分;

(4)在查询词聚类的基础之上,针对每类查询词,利用读者对检索结果的隐式反馈,综合从关联图得出的图书相关性排序、互联网上的图书评分以及文本相似度这三种排序信息源,形成最终的图书搜索结果排序。

所述的提取日志中的图书阅读记录构建图书之间的关联图,使用关联图计算图书的相关性排序得分步骤:分析数字图书馆的Web使用日志数据,提取Web使用日志数据中的读者图书阅读记录,构建共同阅读过图书i和图书j的读者的数量矩阵用U={ui:0≤i<m}表示读者的集合,B={bj:0≤j<n}表示图书的集合,然后对进行归一化处理:

Ci,j=C~i,jwj]]>其中:wj=Σ0i<|B|C~i,j]]>

得到图书关联矩阵Ci,j,使用向量BR=[br0,br1,br2,...,br|B|-1]T表示图书的相关性排序得分,向量d=[d0,d1,d2,...,d|B|-1]T表示图书的已知质量信息,最后使用下面的迭代方法来计算最终的图书相关性排序得分:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810063010.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top