[发明专利]一种基于对抗神经网络生成样本数据的方法以及装置在审
申请号: | 202110036981.5 | 申请日: | 2021-01-12 |
公开(公告)号: | CN112766348A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 李仕林;余正涛;李华风;方正云;李国友;张崇亮 | 申请(专利权)人: | 云南电网有限责任公司电力科学研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 650217 云南省昆*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对抗 神经网络 生成 样本 数据 方法 以及 装置 | ||
本发明公开了一种基于对抗神经网络生成样本数据的方法以及装置,该方法包括:获取随机噪声,并控制对抗神经网络的生成器根据随机噪声生成虚假样本数据;获取训练样本数据,其中,训练样本数据为真实采集图片;将虚假样本数据和训练样本数据输入对抗神经网络的分类器,以使分类器将虚假样本数据和训练样本数据划分为真实数据集和虚假数据集;获取分类器的分类指标;在分类指标满足预设分类标准的情况下,将虚假样本数据作为目标样本数据。这样,可以有效提升样本数据的质量和数量。
技术领域
本申请涉及图像处理技术领域,尤其涉及一种基于对抗神经网络生成样本数据的方法以及装置。
背景技术
在深度学习技术的相关应用研究中,样本的数据量是影响模型识别性能的重要因素。然而,由于目前关于输电线路的巡检图像缺陷检测技术正处在起步阶段,目前可以收集到的缺陷样本数量是很少的,而且获取新的独立样本图像比较困难。因此,现有技术中,样本数据的质量和数量不符合要求。
发明内容
本申请提供了一种基于对抗神经网络生成样本数据的方法以及装置,以解决现有技术中,样本数据的质量和数量不符合要求的问题。
第一方面,本发明提供了一种基于对抗神经网络生成样本数据的方法,包括:
获取随机噪声,并控制对抗神经网络的生成器根据所述随机噪声生成虚假样本数据;
获取训练样本数据,其中,所述训练样本数据为真实采集图片;
将所述虚假样本数据和所述训练样本数据输入所述对抗神经网络的分类器,以使所述分类器将所述虚假样本数据和所述训练样本数据划分为真实数据集和虚假数据集;
获取所述分类器的分类指标;
在所述分类指标满足预设分类标准的情况下,将所述虚假样本数据作为目标样本数据。
可选的,所述将所述虚假样本数据作为目标样本数据,包括:
构建与所述生成器和所述分类器相关的估值函数;
在所述估值函数的数值满足预设估值条件的情况下,将所述虚假样本数据作为所述目标样本数据。
可选的,在所述构建与所述生成器和所述分类器相关的估值函数的步骤之后,所述方法还包括:
根据所述估值函数获取所述分类器的积分函数;
计算所述积分函数的极值点;
根据所述极值点,获取所述分类器的最优解。
可选的,所述根据所述极值点,获取所述分类器的最优解,包括:
对所述积分函数求导数,获得求导结果;
根据所述求导结果,获取所述分类器的最优解。
可选的,在所述根据所述极值点,获取所述分类器的最优解的步骤之后,所述方法还包括:
根据所述分类器的最优解,获取所述生成器的最优解。
可选的,所述根据所述分类器的最优解,获取所述生成器的最优解,包括:
构建两个大于0的相对熵散度;
根据所述两个大于0的相对熵散度,获取JS散度;
根据所述JS散度,获取所述生成器的最优解。
可选的,所述分类指标包括所述生成器的收敛值,所述在所述分类指标满足预设分类标准的情况下,将所述虚假样本数据作为目标样本数据,包括:
在所述生成器的收敛值满足预设收敛条件的情况下,将所述虚假样本数据作为所述目标样本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南电网有限责任公司电力科学研究院,未经云南电网有限责任公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110036981.5/2.html,转载请声明来源钻瓜专利网。