[发明专利]一种文本排序方法及设备在审
申请号: | 201310522789.2 | 申请日: | 2013-10-29 |
公开(公告)号: | CN104572789A | 公开(公告)日: | 2015-04-29 |
发明(设计)人: | 甘文杰;于晓明;杨建武;张涛 | 申请(专利权)人: | 北大方正集团有限公司;北京大学;北京北大方正电子有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 李相雨 |
地址: | 100871 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种文本排序方法及设备,该方法包括:对每一个待排序文本,获取检索请求query中的每一个子词相对于在所述query与该子词相邻的子词的文本偏移差dpage,根据获取到的文本偏移差dpage确定所述query在该待排序文本中的子词偏离系数offset_ratio;根据各个待排序文本对应的子词偏离系数offset_ratio对各个待排序文本进行排序。本发明中,由于query中相邻的子词term在文本中位置关系更能够反映query与该文本的相关性,则根据子词偏离系数做出的排名能够将更为相关的网页优先推荐给用户,从而提升用户体验。 | ||
搜索关键词: | 一种 文本 排序 方法 设备 | ||
【主权项】:
一种文本排序方法,其特征在于,所述方法包括:对每一个待排序文本,获取检索请求query中的每一个子词相对于在所述query与该子词相邻的子词的文本偏移差dpage,dpage表示一个子词在该待排序文本中的位置相对于另一个子词在该待排序文本中的位置的偏移,根据获取到的文本偏移差dpage确定所述query在该待排序文本中的子词偏离系数offset_ratio;根据各个待排序文本对应的子词偏离系数offset_ratio对各个待排序文本进行排序。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京大学;北京北大方正电子有限公司;,未经北大方正集团有限公司;北京大学;北京北大方正电子有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310522789.2/,转载请声明来源钻瓜专利网。
- 上一篇:基于文本语义挖掘的标准化自动建档方法
- 下一篇:一种业务数据库查询统计方法