[发明专利]基于用户点击行为的数字图书搜索方法无效

申请号：	200810063010.4	申请日：	2008-07-04
公开（公告）号：	CN101320375A	公开（公告）日：	2008-12-10
发明（设计）人：	吴江琴;庄越挺;袁川;张寅	申请（专利权）人：	浙江大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	杭州求是专利事务所有限公司	代理人：	张法高
地址：	310027***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于用户点击行为数字图书搜索方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及数字图书馆、信息检索和Web使用挖掘领域，尤其涉及一种基于用户点击行为的数字图书搜索方法。

背景技术

21世纪是数字化的时代，随着计算机技术、海量存储技术和网络技术的飞速发展，信息载体的数字化和信息传播的网络化得到了空前的深化，图书馆的数字化成为一个必然趋势。数字图书馆在世界很多国家受到了高度关注，并取得了迅猛发展，已经成为人们获取信息与知识的重要途径。

数字图书馆中通常拥有海量的数字图书资源，如何有效的利用这些丰富而宝贵的资源，让数字图书馆读者能够更充分的利用他们就显得非常重要。数字图书搜索是数字图书馆必须提供的支撑性服务本，它是数字图书馆中最为重要的一个功能模块，它使得读者能够很好地找到需要的图书资源，是数字图书馆服务平台的“第一线”。

传统的图书资源搜索系统是基于关系数据库的简单匹配查找，只能过滤出与读者所输入的关键字相匹配的相关图书条目，并没有使用有效的图书排序机制以提高读者检索的满意度，而且性能和用户体验不佳。

发明内容

本发明为克服数字图书馆中传统图书搜索系统质量差的缺点，提供了一种高质量的图书搜索结果排序方法。

基于用户点击行为的数字图书搜索方法包括以下步骤：

(1)提取日志中的图书阅读记录构建图书之间的关联图，使用关联图计算图书的相关性排序得分；

(2)提取日志中的检索阅读记录，利用读者对检索结果的隐式反馈对查询词进行聚类；

(3)抓取互联网上的图书评分数据，整合形成图书评分排序得分；

(4)在查询词聚类的基础之上，针对每类查询词，利用读者对检索结果的隐式反馈，综合从关联图得出的图书相关性排序、互联网上的图书评分以及文本相似度这三种排序信息源，形成最终的图书搜索结果排序。

所述的提取日志中的图书阅读记录构建图书之间的关联图，使用关联图计算图书的相关性排序得分步骤：分析数字图书馆的Web使用日志数据，提取Web使用日志数据中的读者图书阅读记录，构建共同阅读过图书i和图书j的读者的数量矩阵用U＝{u_i：0≤i＜m}表示读者的集合，B＝{b_j：0≤j＜n}表示图书的集合，然后对进行归一化处理：

Ci,j=C~i,jwj]]>其中：wj=Σ0≤i<|B|C~i,j]]>

得到图书关联矩阵C_i，j，使用向量BR＝[br₀，br₁，br₂，...，br_|B|-1]^T表示图书的相关性排序得分，向量d＝[d₀，d₁，d₂，...，d_|B|-1]^T表示图书的已知质量信息，最后使用下面的迭代方法来计算最终的图书相关性排序得分：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江大学，未经浙江大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200810063010.4/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于用户点击行为的数字图书搜索方法无效

专利文献下载