[发明专利]基于多模态信息的机器人准确抓取方法及计算机可读介质有效
| 申请号: | 202110218016.X | 申请日: | 2021-02-26 |
| 公开(公告)号: | CN112947458B | 公开(公告)日: | 2022-09-20 |
| 发明(设计)人: | 尤鸣宇;温佳豪;周洪钧 | 申请(专利权)人: | 同济大学 |
| 主分类号: | G05D1/02 | 分类号: | G05D1/02 |
| 代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 应小波 |
| 地址: | 200092 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 多模态 信息 机器人 准确 抓取 方法 计算机 可读 介质 | ||
1.一种基于多模态信息的机器人准确抓取方法,其特征在于,所述的抓取方法包括:
步骤1:获取包含待抓取目标的RGB场景图像,同时获取抓取指令;
所述的包含待抓取目标的RGB场景图像的获取方法为:
通过视觉传感器获取包含待抓取目标的RGB场景图像,视觉传感器设置于机器人操作平台正前方的一定高度上,视觉传感器的角度使其能够拍摄到包含整个操作平台的场景图像;
步骤2:对抓取指令进行关键词匹配,根据抓取指令匹配的关键词得到对应的独热编码;
所述的步骤2具体为:
抓取指令匹配的关键词包括物体类别和倾斜状态;若场景中可能存在的待抓取物体类别总数为n,则每一种类别物体分别对应着一个n维的独热向量;倾斜状态包括正、横和斜三种倾斜状态,每一种倾斜状态分别对应着一个3维的独热向量;根据抓取指令匹配的关键词可以得到一个n维的类别独热编码和一个3维的倾斜状态独热编码,将两者连接得到n+3维的编码;
步骤3:将RGB场景图像和独热编码输入目标定位网络,获取待抓取物体的宽度、旋转角度及其质心的位置坐标;
所述的目标定位网络包括特征提取模块、目标边框生成模块和定位模块;
所述的特征提取模块包括6个卷积层和4个池化层,特征提取模块的输入为视觉传感器获得的场景图像,输出为场景图像的特征图;
所述的目标边框生成模块包括2个卷积层、1个Flatten层和2个全连接层,目标边框生成模块的输入为特征提取模块提取的特征图和抓取指令对应的n+3维编码向量,输出为(p1,p2,…,p8),其中(p1,p2)、(p3,p4)、(p5,p6)和(p7,p8)分别为待抓取物体在场景图像中边框四个角的像素坐标;
所述的定位模块包括2个全连接层,定位模块的输入为目标边框声场模块的结果和抓取指令对应的n+3维编码向量,输出为(w,x,y,α),其中w为对应目标物体的宽度,x为目标物体在坐标系中的x轴坐标值,y为目标物体在坐标系中的y轴坐标值,α为机器人旋转角度;
步骤4:控制机器人移动至对应的抓取位置,然后控制机器人末端执行器旋转对应角度,控制机器人末端执行器下降至设定高度后,控制机器人夹爪调整距离执行抓取任务;
步骤5:完成机器人的准确抓取。
2.根据权利要求1所述的一种基于多模态信息的机器人准确抓取方法,其特征在于,所述的抓取指令为语音形式抓取指令或文本形式抓取指令。
3.根据权利要求2所述的一种基于多模态信息的机器人准确抓取方法,其特征在于,所述的步骤2在进行关键词匹配前要判断抓取指令是语音形式抓取指令还是文本形式抓取指令;
若抓取指令为语音形式抓取指令,则先通过语音识别方法将其转换为对应的文本抓取指令,然后进行关键词匹配,获得对应的独热编码;
若抓取指令为文本形式抓取指令,则直接进行关键词匹配,获得对应的独热编码。
4.根据权利要求1所述的一种基于多模态信息的机器人准确抓取方法,其特征在于,所述的目标定位网络采用端到端训练方式,网络的输入为视觉传感器获得的场景图像以及抓取指令对应的编码向量;
训练数据的标签为待抓取物体在场景图像中边框四个角的像素坐标(px1,py1,…,px4,py4)、待抓取物体的宽度、在定义坐标系下的位置坐标以及旋转角度(w,x,y,α);
进行端到端训练时,网络的损失函数包括:目标边框生成模块预测值(p1,p2,…,p8)和真实值(px1,py1,…,px4,py4)之差的L2范数以及定位模块预测值(a,b,c,d)和真实值(w,x,y,α)之差的L2范数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110218016.X/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





