[发明专利]训练样本的扩展方法、装置、存储介质及设备在审
申请号: | 202110266600.2 | 申请日: | 2021-03-11 |
公开(公告)号: | CN112966757A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 王堃 | 申请(专利权)人: | 江苏禹空间科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/34;G06N3/04 |
代理公司: | 北京德崇智捷知识产权代理有限公司 11467 | 代理人: | 黄雪 |
地址: | 210000 江苏省南京市建邺*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 样本 扩展 方法 装置 存储 介质 设备 | ||
1.一种训练样本的扩展方法,其特征在于,所述方法包括:
获取数据集中的训练集,所述训练集中包括多个原始样本;
对所述训练集中的每个原始样本进行扩展,得到扩展样本;
将所述扩展样本添加到所述训练集中;
当所述训练集中存在类不平衡现象时,采用高斯模糊算法对所述训练集中的各个样本进行修正,所述样本包括所述原始样本和所述扩展样本。
2.根据权利要求1所述的方法,其特征在于,所述对所述训练集中的每个原始样本进行扩展,得到扩展样本,包括:
当对所述训练集中的一个原始样本进行一次扩展时,从四种处理方式中随机选择n种处理方式,所述四种处理方式包括对图像添加高斯噪声、使用拉普拉斯算子对图像进行锐化、对图像进行随机裁剪、对图像的亮度和对比度进行调整,n≥1;
当n=1时,按照选择的处理方式对所述原始样本进行处理,得到一个扩展样本;
当n≥2时,对所述n种处理方式进行随机排序,按照排序后的n种处理方式依次对所述原始样本进行处理,得到一个扩展样本。
3.根据权利要求1所述的方法,其特征在于,所述采用高斯模糊算法对所述训练集中的各个样本进行修正,包括:
获取预设的权值矩阵,所述权值矩阵中包括m×m个像素点的权值,m≥2;
当所述训练集中的样本为灰度图像时,对于所述样本中的每个像素点,计算以所述像素点为中心的m×m个像素点的灰度值与所述权值矩阵的加权平均值,利用所述加权平均值更新所述像素点的灰度值;
将灰度值更新后的样本确定为修正后的样本。
4.根据权利要求1所述的方法,其特征在于,所述采用高斯模糊算法对所述训练集中的各个样本进行修正,包括:
获取预设的权值矩阵,所述权值矩阵中包括m×m个像素点的权值,m≥2;
当所述训练集中的样本为彩色图像时,对于所述样本中的每个像素点,在RGB三个通道中的每个通道中,分别计算以所述像素点为中心的m×m个像素点的灰度值与所述权值矩阵的加权平均值,利用所述加权平均值更新所述像素点的灰度值;
将灰度值更新后的样本确定为修正后的样本。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
根据修正后的训练集对目标检测模型进行训练。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
在训练所述目标检测模型之前,对所述扩展样本的标签进行标注。
7.根据权利要求5所述的方法,其特征在于,所述根据修正后的训练集对目标检测模型进行训练,包括:
采用聚类算法对所述修正后的训练集进行聚类,得到锚框;
根据所述修正后的数据集和所述锚框对所述目标检测模型进行训练。
8.一种训练样本的扩展装置,其特征在于,所述装置包括:
获取模块,用于获取数据集中的训练集,所述训练集中包括多个原始样本;
扩展模块,用于对所述训练集中的每个原始样本进行扩展,得到扩展样本;
添加模块,用于将所述扩展样本添加到所述训练集中;
修正模块,用于当所述训练集中存在类不平衡现象时,采用高斯模糊算法对所述训练集中的各个样本进行修正,所述样本包括所述原始样本和所述扩展样本。
9.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至7任一所述的训练样本的扩展方法。
10.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如权利要求1至7任一所述的训练样本的扩展方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏禹空间科技有限公司,未经江苏禹空间科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110266600.2/1.html,转载请声明来源钻瓜专利网。