[发明专利]随机抽取样本数据的方法、装置、可读介质及存储控制器有效
申请号: | 201710959595.7 | 申请日: | 2017-10-16 |
公开(公告)号: | CN107766486B | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 邵辉;曹雪韬;王宏达;崔冲冲 | 申请(专利权)人: | 浪潮通用软件有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 李世喆 |
地址: | 250100 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 随机 抽取 样本 数据 方法 装置 可读 介质 存储 控制器 | ||
本发明提供了一种随机抽取样本数据的方法、装置、可读介质及存储控制器,方法包括:A0:将样本数据集的各个样本数据排列成一个顺序队列,并确定抽取数量;A1:生成对应于所述顺序队列中位于队首的当前样本数据的随机数;A2:检测所述随机数是否小于所述抽取数量,如果是,则执行A3;否则,执行A4;A3:将位于队首的所述当前样本数据作为参考样本数据取出,并执行A5;A4:将位于队首的所述当前样本数据置于所述顺序队列的队尾,并执行A1;A5:检测取出的各个所述参考样本数据的当前个数,在所述当前个数小于所述抽取数量时,执行A1。通过本发明的技术方案,可更为准确的从样本数据集中随机抽取相应数量的样本数据。
技术领域
本发明涉及计算机技术领域,特别涉及随机抽取样本数据的方法、装置、可读介质及存储控制器。
背景技术
随机抽取样本数据的应用场景非常广阔。具体地,当样本数据集较大时,可通过从样本数据集的大量样本数据中随机抽取出少量的样本数据进行分析以实现相应的业务。
目前,从样本数据集的n个样本数据中随机抽取m样本数据时,可将样本数据集的n个样本数据排列成一个顺序队列,然后根据实际需求生成m个小于n的正整数,进而将顺序队列中对应顺序位与各个正整数相同的m样本数据取出,即实现从样本数据集的n个样本数据中随机抽取出m个样本数据。
上述技术方案中,可能因样本数据集中样本数据的数量过大或过小而导致无法准确的从样本数据集中随机抽取相应数量的样本数据。
发明内容
本发明实施例提供了随机抽取样本数据的方法、装置、可读介质及存储控制器,可更为准确的从样本数据集中随机抽取相应数量的样本数据。
第一方面,本发明提供了一种随机抽取样本数据的方法,包括:
A0:将样本数据集的各个样本数据排列成一个顺序队列,并确定抽取数量;
A1:生成对应于所述顺序队列中位于队首的当前样本数据的随机数;
A2:检测所述随机数是否小于所述抽取数量,如果是,则执行A3;否则,执行A4;
A3:将位于队首的所述当前样本数据作为参考样本数据取出,并执行A5;
A4:将位于队首的所述当前样本数据置于所述顺序队列的队尾,并执行A1;
A5:检测取出的各个所述参考样本数据的当前个数,在所述当前个数小于所述抽取数量时,执行A1。
优选地,
还包括:预先设置至少两个权值表格,每一个所述权值表格分别对应有一个权值系数和至少一个特征信息;
在所述A3之后,进一步包括:
解析所述参考样本数据以确定所述参考样本数据中携带的当前特征信息;
将所述参考样本数据存储至所述至少两个权值表格中的目标权值表格,其中,所述目标权值表格所对应的至少一个目标特征信息包括所述当前特征信息。
优选地,
还包括:
在所述当前个数不小于所述抽取数量时,根据各个所述权值表格中分别存储的参考样本数据的存储数量以及各个所述权值表格所分别对应的权值系数,确定各个所述权值表格所分别对应的筛选数量;
针对于每一个所述权值表格,从所述权值表格存储的各个所述参考样本数据中抽取出对应于所述权值表格的目标筛选数量个目标样本数据。
第二方面,本发明实施例提供了一种随机抽取样本数据的装置,包括:
预处理模块、随机数管理模块、抽取管理模块、队列管理模块和检测模块;其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮通用软件有限公司,未经浪潮通用软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710959595.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置