[发明专利]一种在移动人群环境中的机器人导航方法及系统在审
申请号: | 202210055610.6 | 申请日: | 2022-01-18 |
公开(公告)号: | CN114510038A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 周风余;冯震;薛秉鑫;夏英翔;尹磊 | 申请(专利权)人: | 山东大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张庆骞 |
地址: | 250061 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 移动 人群 环境 中的 机器人 导航 方法 系统 | ||
本发明属于机器人导航技术领域,提供了一种在移动人群环境中的机器人导航方法及系统。其中,该方法包括获取移动人群中各个行人的目标位置、首选速度、航向角、实时位置和实时速度以及机器人的实时位置和实时速度;再基于机器人的风险区域模型,得到移动人群与机器人相邻的行人的风险区域并进行躲避,进而得到机器人的导航路径;其中,所述基于机器人的风险区域模型为:当机器人在限定时间内躲避成功时,通过对应奖励函数得到奖励;当机器人进入风险区域时,通过对应惩罚函数得到惩罚;风险区域的惩罚函数形式和生效范围取决于环境中机器人和行人的实时相对位置和速度。
技术领域
本发明属于机器人导航技术领域,尤其涉及一种在移动人群环境中的机器人导航方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
随着机器人的应用场景逐渐扩展到人机共存环境,对于社交机器人来说,在拥挤的人群环境中安全且符合社会规范的导航至关重要。近年来深度强化学习技术已经在解决人群环境下的机器人导航问题上取得了很大进展。但是发明人发现,目前的人群环境下的机器人导航技术未考虑人群移动速度的影响,从而导致机器人的性能会随着人群移动速度的增长而下降,从而使得机器人无法在快速移动的人群中准确感知环境中的危险。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供一种在移动人群环境中的机器人导航方法及系统,其能够有效地感知环境中的风险,并在快速移动的人群中具有较高的安全性。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供一种在移动人群环境中的机器人导航方法,其包括:
获取移动人群中各个行人的目标位置、首选速度、航向角、实时位置和实时速度以及机器人的实时位置和实时速度;
再基于机器人的风险区域模型,得到移动人群与机器人相邻的行人的风险区域并进行躲避,进而得到机器人的导航路径;
其中,所述基于机器人的风险区域模型为:
当机器人在限定时间内躲避成功时,通过对应奖励函数得到奖励;当机器人进入风险区域时,通过对应惩罚函数得到惩罚;风险区域的惩罚函数形式和生效范围取决于环境中机器人和行人的实时相对位置和速度。
作为一种实施方式,机器人的导航路径是找到一个使期望收益最大化的最优策略
式中表示在t时刻获得的奖励,γ∈(0,1)是一个折扣因子,是最优值函数,是从时间t到时间tΔ=t+Δt的状态转移概率;是在t时刻整个系统的联合状态,是在tΔ时刻整个系统的联合状态,at表示在t时刻的动作;vpref表示首选速度。
作为一种实施方式,使用时间差分学习方法来训练最优值函数。
作为一种实施方式,所述风险区域包括位置风险区域和速度风险区域。
作为一种实施方式,所述惩罚函数为基于速度的惩罚函数和基于位置的惩罚函数的总和。
本发明的第二个方面提供一种在移动人群环境中的机器人导航系统,其包括:
信息获取模块,其用于获取移动人群中各个行人的目标位置、首选速度、航向角、实时位置和实时速度以及机器人的实时位置和实时速度;
路径导航模块,其用于再基于机器人的风险区域模型,得到移动人群与机器人相邻的行人的风险区域并进行躲避,进而得到机器人的导航路径;
其中,所述基于机器人的风险区域模型为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210055610.6/2.html,转载请声明来源钻瓜专利网。