[发明专利]一种文本的检索排序确定方法及系统有效
| 申请号: | 201910082601.4 | 申请日: | 2019-01-28 |
| 公开(公告)号: | CN109857856B | 公开(公告)日: | 2020-05-22 |
| 发明(设计)人: | 郭永红 | 申请(专利权)人: | 北京合享智慧科技有限公司 |
| 主分类号: | G06F16/338 | 分类号: | G06F16/338 |
| 代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 李博洋 |
| 地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文本 检索 排序 确定 方法 系统 | ||
本发明公开了一种文本的检索排序确定方法及系统,该方法包括如下步骤:获取待检索的目标文本和候选文本集合;获取所述目标文本与所述候选文本集合中每个文本的关联度量值;利用所述关联度量值根据第一预设规则对所述候选文本集合中的每个文本进行排序,根据第一预设筛选条件构建第一文本集合;将所述第一文本集合中每个文本根据第二预设规则进行排序,获取目标文本的检索排序结果。本发明提供的实施例,集合多种算法的优势,提高专利检索结果的精准度,提升用户的检索效率。
技术领域
本发明涉及数据处理领域,具体涉及一种文本的检索排序确定方法及系统。
背景技术
现有技术中对文献(例如期刊论文、专利等)进行检索时,利用现有的多个不同种类的相似度计算方法(如结构分析、语义分析、关键词分析等),对候选的文献进行排序后可得出不同的排序结果;此外,对于同一类相似度计算方法,可能也会有不同结果,例如,以语义分析为例,对于同一对专利原文之间的相似度计算结果与其译文之间的相似度计算结果亦有差别。由此,对于同一个目标专利而言,针对不同的解决方案,其候选专利的相似度的排列方式也是多种多样的,每种方式各有其排序规则,得到的排序结果可能差别较大,比如用户真正需要的最相关的专利在其中的一种解决方案中可能排在前10位,在另一种解决方案中可能会排在 1000位以后,这种情况下,用户无法得知最佳的检索结果,并且,如果用户逐一浏览使用各种排列方式的话,也会极大影响检索效率。
发明内容
因此,本发明提供一种文献的检索选取和排序的确定方法及系统,克服了现有技术中对文献检索的排列方式的不同导致的无法得出最佳检索结果的不足。
第一方面,本发明实施例提供一种文本的检索排序确定方法,包括如下步骤:获取待检索的目标文本和候选文本集合;获取所述目标文本与所述候选文本集合中每个文本的关联度量值;利用所述关联度量值根据第一预设规则对所述候选文本集合中的每个文本进行排序,根据第一预设筛选条件构建第一文本集合;将所述第一文本集合中每个文本根据第二预设规则进行排序,获取目标文本的检索排序结果。
在一实施例中,所述将所述第一文本集合中每个文本根据第二预设规则进行排序,获取目标文本的检索排序结果的步骤,包括:将所述第一文本集合中每个文本根据第三预设规则进行排序,根据第二预设筛选条件排除噪声文本,构建第二文本集合;将所述第二文本集合中的每个文本根据第二预设规则进行排序,获取目标文本的检索排序结果。
在一实施例中,获取所述目标文本与所述候选文本集合中每个文本的关联度量值的步骤,包括:利用预设N种关联度量算法分别计算所述目标文本与所述候选文本集合中每个文本的关联度量值,所述N为大于或者等于2 的正整数。
在一实施例中,所述利用所述关联度量值根据第一预设规则对所述候选文本集合中的每个文本进行排序,根据第一预设筛选条件构建第一文本集合的步骤,包括:根据预设N种关联度量算法获取的关联度量值,分别对所述候选文本集合中的每个文本进行排序,得到N种排序集合;对所述N 种排序集合根据第一预设规则进行综合排序,根据第一预设筛选条件构建第一文本集合;优选地,根据第一预设筛选条件构建第一文本集合的步骤包括:根据预设策略对预设N种关联度量算法分别计算所述目标文本与所述候选文本集合中每个文本的关联度量值进行分析,获取分析结果;根据分析结果判断所述候选文本集合中每个文本是否满足预设条件,将候选文本集合中满足所述预设条件的文本选入所述第一文本集合中。
在一实施例中,所述对所述N种排序集合根据第一预设规则进行综合排序,根据第一预设筛选条件构建第一文本集合的步骤,包括:给利用预设N种度量算法获得的关联度量值,根据第一预设规则分别分配权重,将所述关联度量值与对应的权重相乘并相加得到综合关联度量值,根据所述综合关联度量值的大小确定综合排序结果,将大于第一预设综合关联度量值阈值的文本,选入第一文本集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京合享智慧科技有限公司,未经北京合享智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910082601.4/2.html,转载请声明来源钻瓜专利网。





