[发明专利]一种扩充目标识别的训练数据的图像合成方法有效
申请号: | 201810260915.4 | 申请日: | 2018-03-28 |
公开(公告)号: | CN108492343B | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 毛克明;张维益;崔培楠;宋杰 | 申请(专利权)人: | 东北大学 |
主分类号: | G06T11/00 | 分类号: | G06T11/00;G06T7/194;G06K9/62 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 梁焱 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种扩充目标识别的训练数据的图像合成方法,涉及计算机视觉技术领域。该方法针对特定生产场景中的图像数据,进行规模和种类统计,采用K‑Means聚类区分前景图像与底图,将前景与底图以及带有标记的特定场景数据集进行合成,用合成数据来扩充图像数据集。本发明的方法能够自动爬取相关素材图片并将所需素材提取并合成到指定的用户特定场景下,从而在短时间、低成本下获得一定规模的合成数据集达到扩充数据集从而提高其鲁棒性,为增强深度学习模型识别能力提供辅助。 | ||
搜索关键词: | 一种 扩充 目标 识别 训练 数据 图像 合成 方法 | ||
【主权项】:
1.一种扩充目标识别的训练数据的图像合成方法,其特征在于:该方法包括以下步骤:步骤1、根据实际生产场景,进行如下定义:生产场景:具有在实际环境(背景信息)和所需要识别的物体并带有标记的图像的集合;原始图像:通过各种方式获取的带有生产场景信息的图像;图像尺寸:训练数据中,图像的具体尺寸:宽*高);底图:含有生产场景的主要背景信息的图像;对象:需要检测并识别的物体;前景图像:从原始图像中分离并提取带有对象并具有标记的图像;合成图像:含有带有标记信息的对象的底图;根据需求分别确定底图、图像尺寸、对象,并获得原始图像;步骤2、遍历生产场景,统计待识别的对象种类总数,按种类获取含带有各个种类信息的原始图像,并分类保存;步骤3、遍历原始图像,获取图片的尺寸并对图片(三通道)以像素级别进行处理计算得到相应的特征值,根据每个像素计算得到的一组特征值采用K‑Means聚类区分前景图像与底图,返回坐标确定前景位置,生成标注文件完成标注,并保存;步骤4、遍历生产场景,判断生产场景是否为空集,若为空集,则直接进行步骤7,否则获取每张图像中对象的种类以及每个种类的对象总数,并获取对象的标记信息来作为合成图像的输入,同时从生产场景移除该图像,执行步骤5;步骤5、根据步骤4获取每个对象的位置坐标Atop‑left(X,Y)、Abottom‑right(X,Y),即左上角顶点和右下角顶点的坐标,并计算中心坐标
同时计算每个对象的面积Sobiect;步骤6、根据步骤4、步骤5,计算前景图像在底图的空间占比,生成合成图像,返回步骤4;步骤7、当生产场景为空集时,随机挑选步骤3生成的前景图像在底图中进行任意位置的摆放;根据步骤3生成的前景图像数据规模、步骤2确定的种类总数以及步骤1确定的合成图像的尺寸,确定每张合成图像内对象的种类个数以及对象总数来生成合成图像。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810260915.4/,转载请声明来源钻瓜专利网。
- 上一篇:合并碎图的方法、装置、处理器、存储介质和终端
- 下一篇:一种肖像漫画生成方法