[发明专利]一种文本的检索排序确定方法及系统有效
| 申请号: | 201910082601.4 | 申请日: | 2019-01-28 |
| 公开(公告)号: | CN109857856B | 公开(公告)日: | 2020-05-22 |
| 发明(设计)人: | 郭永红 | 申请(专利权)人: | 北京合享智慧科技有限公司 |
| 主分类号: | G06F16/338 | 分类号: | G06F16/338 |
| 代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 李博洋 |
| 地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文本 检索 排序 确定 方法 系统 | ||
1.一种文本的检索排序确定方法,其特征在于,包括如下步骤:
获取待检索的目标文本和候选文本集合;
利用预设N种关联度量算法分别计算所述目标文本与所述候选文本集合中每个文本的关联度量值,所述关联度量值表示目标文本与候选文本集合中每个文本关联度的度量值,所述N为大于或者等于2的正整数;
利用所述关联度量值根据第一预设规则对所述候选文本集合中的每个文本进行排序,根据第一预设筛选条件构建第一文本集合;
将所述第一文本集合中每个文本根据第二预设规则进行排序,获取目标文本的检索排序结果,所述第二预设规则根据与所述目标文本的关联度量值的排序位次进行设定,获取目标文本的检索排序结果,包括:利用N种关联度量算法获取预设样本与候选文本集合中每个文本的关联度量值,并获取预设样本对应最相关文本在候选文本集合中根据关联度量值的得到排序位次,根据预设样本的排位位次的平均召回率或在预设区段上的召回率,给N种关联度量算法设置相应的权重,获取候选文本集合中每个文本的综合排序值,根据综合排序值获取目标文本的检索排序结果;
所述利用所述关联度量值根据第一预设规则对所述候选文本集合中的每个文本进行排序,根据第一预设筛选条件构建第一文本集合的步骤,包括:
根据预设N种关联度量算法获取的关联度量值,分别对所述候选文本集合中的每个文本进行排序,得到N种排序集合;
对所述N种排序集合根据第一预设规则进行综合排序,根据第一预设筛选条件构建第一文本集合。
2.根据权利要求1所述的文本的检索排序确定方法,其特征在于,所述将所述第一文本集合中每个文本根据第二预设规则进行排序,获取目标文本的检索排序结果的步骤,包括:
将所述第一文本集合中每个文本根据第三预设规则进行排序,根据第二预设筛选条件排除噪声文本,构建第二文本集合;
将所述第二文本集合中的每个文本根据第二预设规则进行排序,获取目标文本的检索排序结果。
3.根据权利要求1所述的文本的检索排序确定方法,其特征在于,所述对所述N种排序集合根据第一预设规则进行综合排序,根据第一预设筛选条件构建第一文本集合的步骤,包括:
根据预设策略对预设N种关联度量算法分别计算所述目标文本与所述候选文本集合中每个文本的关联度量值进行分析,获取分析结果;根据分析结果判断所述候选文本集合中每个文本是否满足预设条件,将候选文本集合中满足所述预设条件的文本选入所述第一文本集合中。
4.根据权利要求1所述的文本的检索排序确定方法,其特征在于,所述对所述N种排序集合根据第一预设规则进行综合排序,根据第一预设筛选条件构建第一文本集合的步骤,包括:
给利用预设N种度量算法获得的关联度量值,根据第一预设规则分别分配权重,将所述关联度量值与对应的权重相乘并相加得到综合关联度量值,根据所述综合关联度量值的大小确定综合排序结果,将大于第一预设综合关联度量值阈值的文本,选入第一文本集合。
5.根据权利要求1所述的文本的检索排序确定方法,其特征在于,所述利用所述关联度量值根据第一预设规则对所述候选文本集合中的每个文本进行排序,根据第一预设筛选条件构建第一文本集合的步骤,包括:
根据利用预设N种度量算法获取关联度量值按照大小分别排序,得到N种排序集合;
将所述N种排序集合的各个文本的关联度量值中,大于第一关联度量值阈值和/或小于第一排序位次阈值的文本,选入所述第一文本集合。
6.根据权利要求2所述的文本的检索排序确定方法,其特征在于,所述将所述第一文本集合中每个文本根据第三预设规则进行排序,根据第二预设筛选条件排除噪声文本,构建第二文本集合的步骤,包括:
将第一文本集合中的文本,给利用预设N种度量算法获得的关联度量值根据第三预设规则分别分配权重;
将所述关联度量值与对应的权重相乘并相加得到综合关联度量值;
根据所述综合关联度量值的大小确定综合排序结果;
将小于第二预设综合关联度量值阈值的文本,作为噪声文本;
从第一文本集合中去除所述噪声文本,构建所述第二文本集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京合享智慧科技有限公司,未经北京合享智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910082601.4/1.html,转载请声明来源钻瓜专利网。





