[发明专利]一种基于关键字有序集合的分级排序方法在审
| 申请号: | 201911367322.9 | 申请日: | 2019-12-26 |
| 公开(公告)号: | CN111190993A | 公开(公告)日: | 2020-05-22 |
| 发明(设计)人: | 赵成军 | 申请(专利权)人: | 航天信息股份有限公司企业服务分公司 |
| 主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33 |
| 代理公司: | 北京思创大成知识产权代理有限公司 11614 | 代理人: | 高爽 |
| 地址: | 100086 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 关键字 有序 集合 分级 排序 方法 | ||
本发明提出了一种基于关键字有序集合的分级排序方法,该方法包括:获得关键字有序集合,其中每个关键字具有索引;将所述关键字有序集合中的关键字进行组合,形成不同的子集;将所述子集分级、排序,得到关键字有序组合集合。本方法基于“关键字顺序集合”和“关键字有序组合集合”,强调有序顺序性、组合分级性,并支持关键字、词、句多样化处理,从整体上准确匹配结果,有效提高检索精度,并具有灵活性和易用性。
技术领域
本发明涉及的是计算机技术检索领域,尤其涉及搜索引擎、排序、优选结果集的相关技术和方法,具体涉及一种基于关键字有序集合的分级排序方法。
背景技术
当今社会是信息爆炸的时代,如何从海量数据搜索、提取想要的信息,是一门重要的技术。基于关键字检索、排序、选优相关技术也比较多,一般方法多是按某一个或多个关键字简单而机械的查询或者联合查询。比较好一点方法,或是加入包含权重系统等特征的字典,或是引入算法以计算权重等特征,进行结果上的排序和选优,这在一定程度上提高了的查询的匹配度。
本文提供了一种更优的检索、排序、选优的技术方法,本方法基于“关键字有序集合”和“关键字有序组合集合”,强调有序顺序性、组合分级性,并支持关键字、词、句多样化处理,从整体上准确匹配结果,有效提高检索精度,并有一定的灵活性和易用性。
发明内容
为了解决现有技术的问题,本发明提供了一种基于关键字有序集合的分级排序方法,该方法包括:
获得关键字有序集合,其中每个关键字具有索引;
将所述关键字有序集合中的关键字进行组合,形成不同的子集;
将所述子集分级、排序,得到关键字有序组合集合。
进一步地,所述子集的分级包括:
第一级,对应包括1个关键字的子集;
第二级,对应由2个关键字组合而成的子集;
……
第N级,对应由N个关键字组合而成的子集,N为自然数。
进一步地,所述子集的索引由组合该子集的关键字的索引从小到大组合而成;
同一级别的所述子集按照索引排序,索引越小排序时越靠前,查优度越高。
进一步地,从第一级到第N级,等级逐级增高,等级越高排序时越靠前,查优度越高。
进一步地,将所述关键字有序集合中的关键字分成多组,将每个组内的关键字进行组合形成不同的子集,多组关键字形成多组不同的子集。
进一步地,将多组不同的子集进行分级、排序,得到关键字有序组合集合。
进一步地,获得关键字有序集合包括按照用户输入关键字的次序为关键字设置索引。
进一步地,针对用户输入的句子,使用分词法提取各个关键字;
为提取到的关键字分配权重系数,基于权重系数为关键字设置索引。
进一步地,使用每一个子集元素进行查询检索,获得相应的结果集合。
进一步地,所述结果集合中的每个结果与对应的子集具有相同的分级和索引,并按照分级和索引排序。
本发明提供了一种基于关键字有序集合的分级排序方法。该方法具有以下特点和优势:
一、有序顺序性。本方法基于“关键字有序集合”和“关键字有序组合集合”,强调了关键字顺序和关键字组合顺序的重要性。权重系数的大小、用户输入的次序、词性等各种维度都可以看作顺序索引的体现。索引越小的排序应当越靠前。越靠前的子集表示查优度越高,即依此集合顺序进行信息检索所获取的结果相对是优的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天信息股份有限公司企业服务分公司,未经航天信息股份有限公司企业服务分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911367322.9/2.html,转载请声明来源钻瓜专利网。





