[发明专利]一种快速Top-N排序方法在审
| 申请号: | 202210157203.6 | 申请日: | 2022-02-21 |
| 公开(公告)号: | CN114527954A | 公开(公告)日: | 2022-05-24 |
| 发明(设计)人: | 朱鹏;郑星剑;方伟 | 申请(专利权)人: | 浙江芯昇电子技术有限公司 |
| 主分类号: | G06F7/08 | 分类号: | G06F7/08 |
| 代理公司: | 南京华讯知识产权代理事务所(普通合伙) 32413 | 代理人: | 刘小吉 |
| 地址: | 310051 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 快速 top 排序 方法 | ||
1.一种Top-N排序方法,其特征在于,所述Top-N排序方法包含以下步骤:
数据预处理,所述数据预处理步骤用于确定直方图中区域的个数和区域的范围;
直方图计算,所述直方图计算步骤用于确定每个直方图区域中的样本数;在进行直方图计算时,读取每个样本值的大小,并根据样本值的大小判定该样本哪个直方图区域中,该样本落在哪个bin范围内,将该bin上的样本数加1;
通过所述直方图计算步骤中的计算结果,确定Top-N的有效样本区域;在确定Top-N的有效样本区域时,计算方法如下:计算从第m个bin到第n个bin的样本数的总数Sum,在Top-N的排序中,m或者n其中之一是确定的,第m个bin为最小bin或者第n个bin为最大bin,然后按照顺序对各个bin中的样本数相加,直到样本数的总数Sum大于等于N,确定此时的n或者m值;则第m个bin到第n个bin中的值为有效样本区域;
提取有效样本;以及
对有效样本进行Top-N排序。
2.根据权利要求1中所述的Top-N排序方法,其特征在于,在进行最大值排序时,确定Top-N的有效样本区域时,从最大的bin向最小的bin方向上对每个bin上的样本个数进行累加,直到累加总数大于等于N,则该区间范围则为有效样本区域。
3.根据权利要求1中所述的Top-N排序方法,其特征在于,在进行最小值排序时,确定Top-N的有效样本区域时,从最小的bin向最大的bin方向上对每个bin上的样本个数进行累加,直到累加总数大于等于N,则该区间范围则为有效样本区域。
4.根据权利要求1中所述的Top-N排序方法,其特征在于,在所述数据预处理步骤中确定直方图中区域的个数时,根据样本数据的取值范围而定,样本数据的取值范围越大,直方图中区域的个数越多。
5.根据权利要求1中所述的Top-N排序方法,其特征在于,在所述数据预处理步骤中确定直方图中区域的个数时,根据有效数据量N而定,当有效数据量N越大时,直方图中区域的个数越少。
6.根据权利要求1中所述的Top-N排序方法,其特征在于,在提取有效样本时,对所有样本进行遍历,将样本值落在有效样本区域内的样本提取出来。
7.根据权利要求1中所述的Top-N排序方法,其特征在于,在对有效样本进行Top-N排序时,采用以下排序方法其中之一:冒泡排序、选择排序、快速排序和堆排序。
8.根据权利要求1中所述的Top-N排序方法,其特征在于,在直方图计算时,对每个bin中的样本进行存储。
9.根据权利要求8中所述的Top-N排序方法,其特征在于,在提取有效样本时,将落在有效样本区域内的样本提取出来。
10.根据权利要求8中所述的Top-N排序方法,其特征在于,在对有效样本进行Top-N排序时,先对有效样本区域中每个bin中的样本进行排序,然后从这些数据中找出Top-N。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江芯昇电子技术有限公司,未经浙江芯昇电子技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210157203.6/1.html,转载请声明来源钻瓜专利网。





