[发明专利]一种应用于医药识别的数据增强方法有效
申请号: | 201910168797.9 | 申请日: | 2019-03-06 |
公开(公告)号: | CN109919890B | 公开(公告)日: | 2023-01-20 |
发明(设计)人: | 袁杨;许慧;张群华 | 申请(专利权)人: | 颐保医疗科技(上海)有限公司 |
主分类号: | G06T5/50 | 分类号: | G06T5/50 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 骆文欣 |
地址: | 200131 上海市浦东新区中国*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 医药 识别 数据 增强 方法 | ||
本发明公开了一种应用于医药识别的数据增强方法,包括如下方法:1.使用传统的数据增强技术对训练集中的图片做数据增强,得到新图片;2.构建生成对抗网络生成的新图片;3.使用替换背景颜色来做训练集图片的数据增强,保存下新的图片;4.将原始的训练集的图片与传统数据增强技术生成的新图片、生成对抗网络生成的新图片和背景色替换技术生成的新图片组合成训练样本送入中药材识别人工智能模型中进行训练。本发明生成的新图片与原始图片之间的相关性小,使用这种数据增强技术,能够达到拓展数据集目的的同时,避免传统数据增强技术可能带来的过拟合问题,使基于中药材图片数据集的人工智能模型具有更好的泛化能力。
技术领域
本发明涉及一种数据增强方法,特别是涉及一种应用于医药识别的数据增强方法。
背景技术
近年来,人工智能和大数据技术的高速发展,人工智能算法在中药材识别领域的应用也在不断普及。现有的人工智能技术,例如图像识别技术使用的是深度学习算法。深度神经网络参数众多,结构复杂,需要大量的样本来进行模型训练。汽车、人脸等常见事物可以从网络中获取大量的图片样本,但是中药材由于其特殊性,所有的图片样本都需要自己拍摄得到,因此样本数量通常会有所不足。
数据增强是深度学习中常用的数据预处理方式,通过数据增强技术增加训练样本的数量可以很好的预防模型出现过拟合,从而提高模型的泛化能力。传统的数据增强技术例如:对原始图片镜像、随机翻转、平移变换、按特定比例缩放等。这些增强后的图片样本在初始阶段会有不错的效果,但因为本质上传统的数据增强技术产生的的新图片只是在原始图片上进行微小变化形成的,生成的图片和原始图片在某些局部包含的信息还是完全一致的,随着数据增强的不断继续,样本数量增加对提升模型的效果会越来越不明显。
发明内容
本发明的目的就是提供一种应用于医药识别的数据增强方法,能完全解决上述现有技术的不足之处。
本发明的目的通过下述技术方案来实现:
一种应用于医药识别的数据增强方法,包括如下方法:
1).将拍摄的中药材图片分为训练集和测试集,训练集用来训练模型,当训练集数量不足时,训练集做数据增强处理;测试集用来测试训练完后模型的泛化能力,测试集无需做数据增强处理,保持不变;
2).使用传统的数据增强技术对训练集中的图片做数据增强,得到新图片;
3).构建生成对抗网络,对抗网络由生成模型和判别模型组成,生成模型用来生成新的图片,判别模型用来判断生成的新图片与原始图片是否同类;
4).使用替换背景颜色来做训练集图片的数据增强,首先将图片从RGB格式转变为HSV格式,取图片左上、右上、左下、右下4个顶点的像素值,根据这些像素值和HSV颜色区间像素阈值表,可以得到原始图片的背景颜色;设置此背景色的像素阈值区间,识别出整张图片中的背景区域,设定替换目标背景色的像素阈值,将背景区域内所有像素点的像素值均替换成目标背景色的阈值;将HSV格式的图片转换成RGB格式,保存下新的图片,完成背景色的替换;
5).将原始的训练集的图片与传统数据增强技术生成的新图片、生成对抗网络生成的新图片和背景色替换技术生成的新图片组合成训练样本送入中药材识别人工智能模型中进行训练。
进一步,方法1)中将拍摄的中药材图片数据按4︰1的比例分为训练集和测试集。
进一步,方法3)中生成对抗网络的实现方法是让生成模型和判别模型进行博弈,训练过程中通过相互竞争让这两个模型同时得到增强。
进一步,使用训练集中的中药材图片作为生成对抗网络的训练样本。
进一步,训练集中的图片要经过预处理,保证每张图片像素为512x512。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于颐保医疗科技(上海)有限公司,未经颐保医疗科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910168797.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于双目视差的能见度检测算法
- 下一篇:成像方法、装置、终端及存储介质
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置