[发明专利]一种机器人的人员发现算法在审
申请号: | 201911346845.5 | 申请日: | 2019-12-24 |
公开(公告)号: | CN111240318A | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 秦丽;张赐 | 申请(专利权)人: | 华中农业大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 北京盛凡智荣知识产权代理有限公司 11616 | 代理人: | 李朦 |
地址: | 430070 湖北省*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 机器人 人员 发现 算法 | ||
本发明公开了一种机器人的人员发现算法,此算法基于云模型与部分可观察蒙特卡洛规划,包括硬件部分和软件部分,所述硬件部分包括移动底盘、传感器、激光雷达和上位计算机,所述软件部分包括基于部分可观察蒙特卡洛规划(POMCP)的人员发现算法以及基于云模型的部分可观察蒙特卡洛规划(POMCP)决策算法,本发明公开了一种员发现算法,可用于室内机器人在被追踪人员丢失时,重新发现被追踪人员,本发明算法将云模型原理溶入到部分可观察蒙特卡罗规划(POMCP)人员发现算法中来选择下一个动作,控制机器人移动,使用方便快捷。
技术领域
本发明涉及机器人技术领域,具体是指一种机器人的人员发现算法。
背景技术
机器人产业在近些年发展得非常迅速,尤其是社会服务机器人已成为工业机器人、物流机器人之后广 受关注的机器人发展领域。家庭跟随机器人可用于独自在家的特殊人群,如残疾人、儿童或老年人的跟踪、 摔倒或危险动作检测等,为家人提供必要的通知服务。但在人员跟踪过程中,由于障碍物的阻挡以及人员 移动速度、方向的突然变化,会造成被追踪人员的丢失,这时通常的做法是机器人原地等待到被跟踪人员 再次出现,这样可能会造成被跟踪人员出现危险时,不能被及时检测到。因此在丢失被跟踪人员后,如何 重新找到被跟踪人员是一个待解决的问题。
发明内容
为解决上述技术问题,本发明提供的技术方案为:一种机器人的人员发现算法,此算法基于云模型与 部分可观察蒙特卡洛规划,包括硬件部分和软件部分,所述硬件部分包括移动底盘、传感器、激光雷达和 上位计算机,所述软件部分包括基于部分可观察蒙特卡洛规划(POMCP)的人员发现算法以及基于云模 型的部分可观察蒙特卡洛规划(POMCP)决策算法。
作为改进,所述基于POMDP的人员发现算法具体包括以下内容:
(1)建立部分可观察的马尔可夫决策(POMDP)模型
(1.1)定义状态s:POMDP模型包含一组状态s,在人员发现算法中,状态s被定义为机器人和人的 位置:(srobot,sperson);
(1.2)定义机器人动作a:机器人可以执行有限集合a中的动作,即机器人可以在八个方向之一上移 动,或停留原地;当机器人在寻找时,机器人观察值o等于状态s,但是当人的位置(sperson)不可见时, sperson=hidden;
(1.3)机器人动作a从一种状态s到另一种状态s'的概率由T=P(s'|s,a)定义,而观察概率由Z=P (o|s',a)定义;
(1.4)奖励函数R是用于指导学习过程,表明状态s下,那些动作是最佳的,奖励函数定义为-d,d 是人与机器人之间的最短路径距离;
(1.5)POMDP模型存储人处于每种可能状态的概率,定义为信念b;初始值信念b0定义为人员在所 有位置上均匀分布的概率,使用观察和概率函数更新信念;通过计算值函数来决定对每个信念状态执行的 最佳动作:
其中R(b,a)是对信念状态b和动作a的奖励,γ是折扣因子,V(b)=maxa∈AQ(b,a),τ(b,a,o)是下一 个信念状态b’;
(2)建立决策树:POMCP是POMDP仿真器生成具有两种类型节点的策略树,包括代表信念状态的 信念节点,以及通过执行动作而产生的动作子节点;
(3)建立基于POMCP的决策算法
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中农业大学,未经华中农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911346845.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:高性能状态存储单元的实现方法
- 下一篇:一种用于单轴温控转台的锁机构