[发明专利]基于用户点击行为的数字图书搜索方法无效
申请号: | 200810063010.4 | 申请日: | 2008-07-04 |
公开(公告)号: | CN101320375A | 公开(公告)日: | 2008-12-10 |
发明(设计)人: | 吴江琴;庄越挺;袁川;张寅 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州求是专利事务所有限公司 | 代理人: | 张法高 |
地址: | 310027*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户 点击 行为 数字 图书 搜索 方法 | ||
技术领域
本发明涉及数字图书馆、信息检索和Web使用挖掘领域,尤其涉及一种基于用户点击行为的数字图书搜索方法。
背景技术
21世纪是数字化的时代,随着计算机技术、海量存储技术和网络技术的飞速发展,信息载体的数字化和信息传播的网络化得到了空前的深化,图书馆的数字化成为一个必然趋势。数字图书馆在世界很多国家受到了高度关注,并取得了迅猛发展,已经成为人们获取信息与知识的重要途径。
数字图书馆中通常拥有海量的数字图书资源,如何有效的利用这些丰富而宝贵的资源,让数字图书馆读者能够更充分的利用他们就显得非常重要。数字图书搜索是数字图书馆必须提供的支撑性服务本,它是数字图书馆中最为重要的一个功能模块,它使得读者能够很好地找到需要的图书资源,是数字图书馆服务平台的“第一线”。
传统的图书资源搜索系统是基于关系数据库的简单匹配查找,只能过滤出与读者所输入的关键字相匹配的相关图书条目,并没有使用有效的图书排序机制以提高读者检索的满意度,而且性能和用户体验不佳。
发明内容
本发明为克服数字图书馆中传统图书搜索系统质量差的缺点,提供了一种高质量的图书搜索结果排序方法。
基于用户点击行为的数字图书搜索方法包括以下步骤:
(1)提取日志中的图书阅读记录构建图书之间的关联图,使用关联图计算图书的相关性排序得分;
(2)提取日志中的检索阅读记录,利用读者对检索结果的隐式反馈对查询词进行聚类;
(3)抓取互联网上的图书评分数据,整合形成图书评分排序得分;
(4)在查询词聚类的基础之上,针对每类查询词,利用读者对检索结果的隐式反馈,综合从关联图得出的图书相关性排序、互联网上的图书评分以及文本相似度这三种排序信息源,形成最终的图书搜索结果排序。
所述的提取日志中的图书阅读记录构建图书之间的关联图,使用关联图计算图书的相关性排序得分步骤:分析数字图书馆的Web使用日志数据,提取Web使用日志数据中的读者图书阅读记录,构建共同阅读过图书i和图书j的读者的数量矩阵用U={ui:0≤i<m}表示读者的集合,B={bj:0≤j<n}表示图书的集合,然后对进行归一化处理:
得到图书关联矩阵Ci,j,使用向量BR=[br0,br1,br2,...,br|B|-1]T表示图书的相关性排序得分,向量d=[d0,d1,d2,...,d|B|-1]T表示图书的已知质量信息,最后使用下面的迭代方法来计算最终的图书相关性排序得分:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810063010.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:低压漏电保护器检测器
- 下一篇:选齿装置及使用该选齿装置的定寸机