[发明专利]使用相关性反馈进行数据库搜索的方法及相应的储存介质无效
申请号: | 201010121228.8 | 申请日: | 2010-02-11 |
公开(公告)号: | CN101963971A | 公开(公告)日: | 2011-02-02 |
发明(设计)人: | 刘焕祚 | 申请(专利权)人: | 浦项工科大学校产学协力团 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 刘瑜;王英 |
地址: | 韩国*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 相关性 反馈 进行 数据库 搜索 方法 相应 储存 介质 | ||
优先权要求
本申请要求2009年7月23日在韩国知识产权局(KIPO)递交的韩国专利申请No.2009-0067086的优先权,特此通过引用并入该韩国专利申请的全部内容。
背景
1.技术领域
本发明的示例性实施例总体上涉及数据库,并且更具体地,涉及进行数据库搜索的方法以及其上记录有用于执行该方法的程序的记录介质。
2.背景技术
在一般的数据库搜索中获得期望的数据或文档是困难的,因为用户不能容易地使用查询界面和关键字来表示具体的搜索,并且提供有太多搜索结果。例如,在PubMed数据库(生物医学研究中重要的信息来源)的情况下,当输入诸如“乳腺癌”这样的关键字时,返回了二十万个或更多文档作为搜索结果。在这种情况下,用户必须进行预处理,例如参照出版日期、作者、文章名称等对搜索结果进行排序,并且随后不便于查找期望的文章。
同时,已经研究了重新排列搜索结果以便用户可以容易地获得期望结果的方法,例如,如从搜索网站Google所看到的,通过文档的引用信息来计算文档总体重要性并且使用所计算的重要性来对搜索结果进行分级(rank)的方法。为了解决上述问题,已经考虑了使用机械训练策略的方法。然而,该方法受限于训练过程和分级过程是离线进行的并且需要大量训练数据来获得在特定水准之上的搜索准确度。
存在另一个问题,即针对同一关键字查询,不同的用户可能期望不同的结果。例如,对于同一关键字“乳腺癌”,一个用户可能期望遗传学相关的文章,而另一用户可能期望关于最新癌症手术的文章。基于总体重要性的分级策略通常无法响应特定用户对信息(即个性化信息)的请求。
发明内容
因此,提供本发明的示例性实施例来基本地避免由于现有技术的限制和缺点造成的一个或更多问题。
本发明的示例性实施例提供使用相关性反馈来进行数据库搜索的方法,以使得用户可以使用反馈获得更准确的期望的搜索结果。
本发明的示例性实施例还提供具有指令程序的记录介质,所述指令程序被有形地实施、记录于所述记录介质上,并且可由执行使用相关性反馈进行数据库搜索的方法的数字处理装置执行,所述记录介质是所述数字处理装置可读的。
在一些示例性实施例中,一种进行数据库搜索的方法包括:接收对第一搜索结果的相关性反馈;基于所接收的相关性反馈得出相关性函数;以及将所述第一搜索结果应用到所述相关性函数,并且提供根据相关性级别排序的第二搜索结果。
所述接收相关性反馈可以包括:接收包含搜索条件的查询;提供对应于所述查询的第一搜索结果;以及接收对所述第一搜索结果的相关性反馈。
所述得出相关性函数可以包括:使用分级策略得出所述相关性函数,以根据所述第一搜索结果中包括的每个数据的相关性级别来返回分级评分,所述分级策略基于所接收的相关性反馈。
所述分级策略可以是分级支持向量机(RankSVM)、RankNet和RankBoost之一。
所述得出相关性函数可以是以SQL语法的以下形式而进行的:使用包含训练数据的训练表作为输入因子,而使用包含已训练结果数据的模型表作为输出因子。
所述训练表可以包括实例标识符属性、描述实例的特征向量属性,以及所述实例的分级标签属性。
所述得出相关性函数和所述应用第一搜索结果至少之一可以是以单独的独立查询语言指令的形式或者整合到现有查询语言的指令的形式,在数据库系统上进行的。
所述应用第一搜索结果可以是以SQL语法的以下形式进行的:将包含已训练结果数据的模型表和包含要被预测的数据的测试表用作输入因子,而将包含通过对所要被预测的数据给出分级评分所获得的结果数据的结果表用作输出因子。
所述测试表可以包括实例标识符属性和描述实例的特征向量属性,并且所述结果表可以包括所述实例标识符属性和实例的分级评分属性。
所述相关性反馈可以是对所述第一搜索结果的多级相关性反馈和对所述第一搜索结果的相对相关性排序反馈之一。
所述相关性函数可以被储存为数据库系统上的表。
在其他示例性实施例中,一种记录介质具有指令程序,所述指令程序被有形地实施、记录于所述记录介质上,并且可由执行用于进行数据库搜索的方法的数字处理装置来执行,所述记录介质是所述数字处理装置可读的。所述程序进行以下操作:接收对第一搜索结果的相关性反馈;基于所接收的相关性反馈得出相关性函数;以及将所述第一搜索结果应用到所述相关性函数,并且提供根据相关性级别排序的第二搜索结果。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浦项工科大学校产学协力团,未经浦项工科大学校产学协力团许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010121228.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像处理装置及图像处理方法
- 下一篇:机架安装计算机