[发明专利]模型的采样算法匹配方法、装置和电子设备在审
| 申请号: | 202110159651.5 | 申请日: | 2021-02-04 |
| 公开(公告)号: | CN112819079A | 公开(公告)日: | 2021-05-18 |
| 发明(设计)人: | 刘硕 | 申请(专利权)人: | 维沃移动通信有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 马铁良 |
| 地址: | 523863 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 采样 算法 匹配 方法 装置 电子设备 | ||
本申请公开了一种模型的采样算法匹配方法、装置和电子设备,属于模型采样技术领域。所述方法包括:获取采样算法集,采样算法集包括多个采样算法;分别通过所述采样算法集中每一采样算法进行样本采样,得到每一采样算法对应的目标训练样本集;分别通过每一目标训练样本集训练目标模型的模型参数,得到多个训练后的模型;根据每一所述训练后的模型的评价指标值,在所述采样算法集中确定与所述目标模型相匹配的采样算法,能够提高模型检测性能。
技术领域
本申请属于模型采样技术领域,具体涉及一种模型的采样算法匹配方法、装置和电子设备。
背景技术
数据采样是模型建设中的常见数据处理过程,利用采样后的数据对模型进行训练,但在采样过程中会遇到数据不平衡的场景,数据不平衡会影响模型效果,模型的泛化能力较弱,导致模型的预测不准确的现象。为了应对模型不平衡的问题,现有技术中采取传统的随机过采样(ROS)或者利用插值方法合成少数类样本(smote)来实现达到数据平衡。
但是现有技术中至少存在如下问题:ROS采样和smote采样只是简单使得正负样本在数量上达到相等,并未考虑到数据的真实分布情况。例如,ROS采样是通过随机过采样合成样本点,只是重复的在原始少数类样本周围增加少数类样本数量,对模型检测效果的提升不大,甚至可能比不进行采样下的模型效果差;smote采样是在多数类样本中生成少数类样本,增加了原始数据噪声,影响特征的区分度以及模型的性能。
因此,有必要针对不同的模型选择与之最匹配的采样算法。
本申请实施例的目的是提供一种模型的采样算法匹配方法、装置和电子设备,能够解决由于采样技术不适配导致模型检测性能不高的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种模型的采样算法匹配方法,该方法包括:
获取采样算法集,所述采样算法集包括多个采样算法;
分别通过所述采样算法集中每一采样算法进行样本采样,得到所述每一采样算法对应的目标训练样本集;
分别通过每一目标训练样本集训练目标模型,得到多个训练后的模型;
根据每一所述训练后的模型的评价指标值,在所述采样算法集中确定与所述目标模型相匹配的采样算法。
第二方面,本申请实施例提供了一种模型的采样算法匹配装置,其特征在于,包括:
算法获取模块,用于获取采样算法集,所述采样算法集包括多个采样算法;
采样模块,用于分别通过所述采样算法集中每一采样算法进行样本采样,得到所述每一采样算法对应的目标训练样本集;
训练模块,用于分别通过每一目标训练样本集训练目标模型,得到多个训练后的模型;
匹配模块,用于根据每一所述训练后的模型的评价指标值,在所述采样算法集中确定与所述目标模型相匹配的采样算法。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于维沃移动通信有限公司,未经维沃移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110159651.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种拘束托盘
- 下一篇:一种电动汽车组合电池检测系统及电池测试机





