[发明专利]一种基于深度学习的三维目标识别与最优抓取方法在审
申请号: | 201910077632.0 | 申请日: | 2019-01-26 |
公开(公告)号: | CN109784297A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 陈丹;林清泉 | 申请(专利权)人: | 福州大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/46;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市闽*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标物体 抓取 三维目标 二分法 获取目标 获取图像 目标识别 第一级 检测 位姿 成像 出错 改进 相机 图像 学习 分割 概率 | ||
1.一种基于深度学习的三维目标识别与最优抓取方法,其特征在于,包括如下步骤:
步骤S1、采用Kinect相机获取图像,并进行图像预处理;
步骤S2、在第一级构造一个改进的faster RCNN模型,对图像中的目标物体进行识别和定位,分割出目标物体所在的区域并进行相应的旋转;
步骤S3、在第二级构造一个新的faster RCNN模型,获取目标物体最优抓取部位的坐标和旋转角度,实现目标物体的最优抓取。
2.根据权利要求1所述的一种基于深度学习的三维目标识别与最优抓取方法,其特征在于,在步骤S1中,所述图像预处理,包括对深度图像进行轮廓提取,并将轮廓图像、彩色图像和深度图像分别按预定比例的权值进行像素值相加,得到融合图像。
3.根据权利要求1所述的一种基于深度学习的三维目标识别与最优抓取方法,其特征在于,在步骤S2中,所述改进的faster RCNN模型,包括依次连接的卷积层1、池化层1、卷积层2、卷积层3、卷积层4、池化层2、卷积层5、融合层,所述卷积层3还与融合层连接,同时,为了能识别成像小的物体,对卷积层2和卷积层4的参数进行调整,即卷积层2的参数调整为:卷积核大小为3*3,边缘扩展数为1,步长为1;卷积层4的参数调整为:卷积核大小为5*5,边缘扩展数为2,步长为2。
4.根据权利要求3所述的一种基于深度学习的三维目标识别与最优抓取方法,其特征在于,在步骤S2中,所述在第一级构造一个改进的faster RCNN模型,对图像中的目标物体进行识别和定位的具体实现过程为:将经步骤S1进行图像预处理得到的融合图像,输入改进的faster RCNN模型,经过5层卷积层的提取和特征图像融合,然后与训练好的类别特征进行比较,得到目标物体的类别及位置。
5.根据权利要求1所述的一种基于深度学习的三维目标识别与最优抓取方法,其特征在于,在步骤S2中,分割出目标物体所在的区域并进行相应的旋转的具体过程为:
步骤S21、根据改进的faster RCNN模型,对图像中的目标物体的识别和定位,寻找目标物体的轮廓,从而将目标物体从图像中分割出来:
步骤S22、采用最小包围矩形包围目标物体的轮廓,并确定旋转范围:
步骤S23、采用二分法将图像进行多次旋转。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910077632.0/1.html,转载请声明来源钻瓜专利网。