[发明专利]一种用于深度学习的物品识别数据集扩充方法及系统在审
申请号: | 202110873498.2 | 申请日: | 2021-07-30 |
公开(公告)号: | CN113570534A | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 田国会;王中立;冯晨锐 | 申请(专利权)人: | 山东大学 |
主分类号: | G06T5/50 | 分类号: | G06T5/50;G06T7/11;G06T7/60;G06T7/70;G06T3/60;G06T3/00;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 董雪 |
地址: | 250061 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 深度 学习 物品 识别 数据 扩充 方法 系统 | ||
本公开公开的一种用于深度学习的物品识别数据集扩充方法及系统,包括:获取背景图像和物品图像;对物品图像进行标记,获取标注图像;对标注图像进行旋转,获取旋转后标注图像,利用背景图像对旋转后标注图像的背景进行更换,获得背景更换后标注图像;改变背景更换后的标注图像的大小,获取改变大小后的背景更换后标注图像,从改变大小后的背景更换后标注图像中选取两幅图像进行融合,获得复杂背景标注图像;利用复杂背景标注图像对物品识别数据集进行扩充。通过该扩充后的数据集对用于物品识别的深度学习网络进行训练时,能够获得良好的训练效果。
技术领域
本发明涉及机器人视觉应用技术领域,尤其涉及一种用于深度学习的物品识别数据集扩充方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
随着深度学习技术的不断深入的背景下,深度学习技术在实际场景中的应用也日益广泛,但是,由于深度学习技术的实际应用需要数量巨大且质量较高的人工标注数据,人工标记过程保证了数据质量,但是也耗费大量人力以及资金,同时也增加了时间成本。因此,单纯的依赖人工标记限制了深度学习技术的进一步实际部署,尤其在机器人应用领域。
常用的且已经公开的开源数据集,如ImageNet数据集,COCO数据集,VOC数据集等,这些数据集可以用于物品的识别,分割网络训练,但不能进行可供性分割网络训练,可供性指的是物品可以承受的机器人的动作,即机器人可以对物品的不同功能部分施加不同的动作,实现机器人对物品的认知操作。
故发明人认为,利用现有数据集对用于物品识别分割的深度学习网络进行训练时,首先无法获取大量的人工标注图像,从而使得对深度学习网络的训练效果有限,此次,现有的数据集对深度学习网络进行训练后可用于对物品进行识别分割,而不能进行物品的可供性分割。
发明内容
本公开为了解决上述问题,提出了一种用于深度学习的物品识别数据集扩充方法及系统,实现了对物品识别数据集的扩充,利用该扩充后的数据集进行深度学习网络训练时,保证了深度学习网络训练的效果。
为实现上述目的,本公开采用如下技术方案:
第一方面,提出了一种用于深度学习的物品识别数据集扩充方法,包括:
获取背景图像和物品图像;
对物品图像进行标记,获取标注图像;
对标注图像进行旋转,获取旋转后标注图像,利用背景图像对旋转后标注图像的背景进行更换,获得背景更换后标注图像;
改变背景更换后的标注图像的大小,获取改变大小后的背景更换后标注图像,从改变大小后的背景更换后标注图像中选取两幅图像进行融合,获得复杂背景标注图像;
利用复杂背景标注图像对物品识别数据集进行扩充。
第二方面,提出了一种用于深度学习的物品识别数据集扩充系统,包括:
图像获取模块,用于获取背景图像和物品图像;
图像标记模块,用于对物品图像进行标记,获取标注图像;
背景更换后标注图像获取模块,用于对标注图像进行旋转,获取旋转后标注图像;利用背景图像对旋转后标注图像的背景进行更换,获得背景更换后标注图像;
复杂背景标注图像获取模块,用于改变背景更换后的标注图像的大小,获取改变大小后的背景更换后标注图像,从改变大小后的背景更换后标注图像中选取两幅图像进行融合,获得复杂背景标注图像;
数据集扩充模块,用于利用复杂背景标注图像对物品识别数据集进行扩充。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110873498.2/2.html,转载请声明来源钻瓜专利网。