[发明专利]一种应用于医药识别的数据增强方法有效

专利信息
申请号: 201910168797.9 申请日: 2019-03-06
公开(公告)号: CN109919890B 公开(公告)日: 2023-01-20
发明(设计)人: 袁杨;许慧;张群华 申请(专利权)人: 颐保医疗科技(上海)有限公司
主分类号: G06T5/50 分类号: G06T5/50
代理公司: 北京品源专利代理有限公司 11332 代理人: 骆文欣
地址: 200131 上海市浦东新区中国*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 应用于 医药 识别 数据 增强 方法
【说明书】:

发明公开了一种应用于医药识别的数据增强方法,包括如下方法:1.使用传统的数据增强技术对训练集中的图片做数据增强,得到新图片;2.构建生成对抗网络生成的新图片;3.使用替换背景颜色来做训练集图片的数据增强,保存下新的图片;4.将原始的训练集的图片与传统数据增强技术生成的新图片、生成对抗网络生成的新图片和背景色替换技术生成的新图片组合成训练样本送入中药材识别人工智能模型中进行训练。本发明生成的新图片与原始图片之间的相关性小,使用这种数据增强技术,能够达到拓展数据集目的的同时,避免传统数据增强技术可能带来的过拟合问题,使基于中药材图片数据集的人工智能模型具有更好的泛化能力。

技术领域

本发明涉及一种数据增强方法,特别是涉及一种应用于医药识别的数据增强方法。

背景技术

近年来,人工智能和大数据技术的高速发展,人工智能算法在中药材识别领域的应用也在不断普及。现有的人工智能技术,例如图像识别技术使用的是深度学习算法。深度神经网络参数众多,结构复杂,需要大量的样本来进行模型训练。汽车、人脸等常见事物可以从网络中获取大量的图片样本,但是中药材由于其特殊性,所有的图片样本都需要自己拍摄得到,因此样本数量通常会有所不足。

数据增强是深度学习中常用的数据预处理方式,通过数据增强技术增加训练样本的数量可以很好的预防模型出现过拟合,从而提高模型的泛化能力。传统的数据增强技术例如:对原始图片镜像、随机翻转、平移变换、按特定比例缩放等。这些增强后的图片样本在初始阶段会有不错的效果,但因为本质上传统的数据增强技术产生的的新图片只是在原始图片上进行微小变化形成的,生成的图片和原始图片在某些局部包含的信息还是完全一致的,随着数据增强的不断继续,样本数量增加对提升模型的效果会越来越不明显。

发明内容

本发明的目的就是提供一种应用于医药识别的数据增强方法,能完全解决上述现有技术的不足之处。

本发明的目的通过下述技术方案来实现:

一种应用于医药识别的数据增强方法,包括如下方法:

1).将拍摄的中药材图片分为训练集和测试集,训练集用来训练模型,当训练集数量不足时,训练集做数据增强处理;测试集用来测试训练完后模型的泛化能力,测试集无需做数据增强处理,保持不变;

2).使用传统的数据增强技术对训练集中的图片做数据增强,得到新图片;

3).构建生成对抗网络,对抗网络由生成模型和判别模型组成,生成模型用来生成新的图片,判别模型用来判断生成的新图片与原始图片是否同类;

4).使用替换背景颜色来做训练集图片的数据增强,首先将图片从RGB格式转变为HSV格式,取图片左上、右上、左下、右下4个顶点的像素值,根据这些像素值和HSV颜色区间像素阈值表,可以得到原始图片的背景颜色;设置此背景色的像素阈值区间,识别出整张图片中的背景区域,设定替换目标背景色的像素阈值,将背景区域内所有像素点的像素值均替换成目标背景色的阈值;将HSV格式的图片转换成RGB格式,保存下新的图片,完成背景色的替换;

5).将原始的训练集的图片与传统数据增强技术生成的新图片、生成对抗网络生成的新图片和背景色替换技术生成的新图片组合成训练样本送入中药材识别人工智能模型中进行训练。

进一步,方法1)中将拍摄的中药材图片数据按4︰1的比例分为训练集和测试集。

进一步,方法3)中生成对抗网络的实现方法是让生成模型和判别模型进行博弈,训练过程中通过相互竞争让这两个模型同时得到增强。

进一步,使用训练集中的中药材图片作为生成对抗网络的训练样本。

进一步,训练集中的图片要经过预处理,保证每张图片像素为512x512。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于颐保医疗科技(上海)有限公司,未经颐保医疗科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910168797.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top