[发明专利]一种动态环境下机械手自主避障规划方法和系统在审
| 申请号: | 202210085345.6 | 申请日: | 2022-01-25 |
| 公开(公告)号: | CN114414231A | 公开(公告)日: | 2022-04-29 |
| 发明(设计)人: | 陈鹏展;袁帅铭;裴结安 | 申请(专利权)人: | 台州学院 |
| 主分类号: | G01M13/00 | 分类号: | G01M13/00;G06F30/20;B25J9/16 |
| 代理公司: | 宁波博灵知识产权代理事务所(普通合伙) 33424 | 代理人: | 俞鹏程 |
| 地址: | 318000 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 动态 环境 机械手 自主 规划 方法 系统 | ||
本发明公开了一种动态环境下机械手自主避障规划方法和系统,包括对机械手和障碍物进行简化建模,并建立机械手和障碍物的碰撞检测模型;建立无模型深度学习算法模型并进行碰撞训练;根据无模型深度学习算法模型得到机械手自主避障路径,通过设置碰撞负奖励,将避障对象描述为强化学习的对象,即将动态环境下机械手的避障抓取问题描述为寻找使总奖励最大化策略的问题。另外,针对机械手和复杂障碍物两种不规则实体设计了碰撞检测算法,解决了两个不规则实体间的碰撞检测问题。
技术领域
本发明属于机械手技术领域,具体涉及一种动态环境下机械手自主避障规划方法和系 统。
背景技术
机械手是一种模仿人手手动作的自动操作装置,作为工业机器人的一个分支,其具有 通用性强、运动灵活、易于控制等优点,因而被广泛应用于搬运、焊接、喷涂、切割等领域。通常,机械手的工作场景并不是自由的空间,而是包含较多障碍物的约束空间,因此 在含障碍物约束的空间进行路径规划一直是研究的热点,避障规划技术的好坏直接影响着机械手的控制效果,随着生产需求的扩大和应用场景的复杂化,工作场景中经常会含有一些运动的障碍物,这对工业机械手的作业规划提出了更高的需求,即要求机械手在执行任务的同时不与环境中运动的障碍物发生碰撞。相比传统静态环境下的避障规划,动态环境下机械手的避障抓取主要存在以下几个问题:
(1)动态环境下障碍物的位置实时在改变,如何根据障碍物的运动情况及时调整避障 规划路径,是实现机械手在动态障碍物环境中安全作业的关键。
(2)由于高自由度机械手路径规划问题是一个高维问题,规划空间较大,这使得规划 难度变得异常困难。
(3)大量的在线的碰撞检测成为限制算法规划效率的瓶颈,如何对机械手以及障碍物 进行建模是实现机械手在动态障碍物环境中规划的关键。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一:提供一种动态环境下 机械手自主避障规划方法,它包括,其特征在于:
对机械手和障碍物进行简化建模,并建立机械手和障碍物的碰撞检测模型;
建立无模型深度学习算法模型并进行碰撞训练;
根据无模型深度学习算法模型得到机械手自主避障路径。
根据本发明的一个示例,无模型深度学习算法模型定义为
根据本发明的一个示例,对无模型深度学习算法模型设计优先经验回放机制,以TD误 差ξ作为评价经验值的指标,
根据本发明的一个示例,还包括:对无模型深度学习算法模型设计奖励函数,奖励函 数:
本发明旨在至少在一定程度上解决相关技术中的技术问题之一:一种动态环境下机械 手自主避障规划系统,它包括,其特征在于,
对机械手和障碍物进行简化建模,并建立机械手和障碍物的碰撞检测模块;
建立无模型深度学习算法模块并进行碰撞训练;
根据无模型深度学习算法模块得到机械手自主避障路径。
根据本发明的一个示例,无模型深度学习算法模块定义为
根据本发明的一个示例,对无模型深度学习算法模块设计优先经验回放机制,以TD误 差ξ作为评价经验值的指标,
根据本发明的一个示例,还包括:对无模型深度学习算法模块设计奖励函数,奖励函 数:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于台州学院,未经台州学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210085345.6/2.html,转载请声明来源钻瓜专利网。





