[发明专利]路径跟随方法、系统、电子设备和存储介质有效
申请号: | 201811191784.5 | 申请日: | 2018-10-12 |
公开(公告)号: | CN110362070B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 高萌;李雨倩;刘懿;李浩 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 袁礼君;阚梓瑄 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 路径 跟随 方法 系统 电子设备 存储 介质 | ||
1.一种路径跟随方法,其特征在于,包括以下步骤:
根据栅格地图,获得起点栅格至终点栅格的规划路径和基于规划路径扩展得到的路径区域,并获得路径区域内每个栅格规避障碍物的初始值;
其中,基于规划路径扩展得到路径区域的步骤包括:根据代价地图获得栅格地图的自由移动区域,在自由移动区域中自规划路径向两侧扩展预设距离,生成位于规划路径的两侧且与规划路径相平行的两条边界;以两条边界为障碍物,生成位于两条边界之间的路径区域,路径区域内每个栅格具有规避障碍物的初始值;
自起点栅格起遍历获得路径区域内每个栅格基于动作集合中每个动作ai的代价值,包括:
获得当前栅格sn执行每个动作ai能到达的下一栅格sn+1的初始值,作为当前栅格sn基于每个动作ai的当前收益Rn;
获得每个下一栅格sn+1再执行每个动作ai能到达的再下一栅格sn+2的初始值中的最大值max(Q(sn+1,ai));
根据当前收益Rn和最大值max(Q(sn+1,ai))获得当前栅格sn基于每个动作ai的代价值Q(sn,ai)。
2.如权利要求1所述的路径跟随方法,其特征在于,还包括步骤:
于当前栅格sn执行代价值Q(sn,ai)中最小代价值对应的动作。
3.如权利要求1所述的路径跟随方法,其特征在于,获得代价值Q(sn,ai)的步骤中,根据当前收益Rn和当前栅格sn基于每个动作ai的未来收益Wn获得代价值Q(sn,ai),未来收益Wn=γ(max(Q(sn+1,ai))),γ为折扣因子,表示牺牲当前收益换取未来收益的程度,0γ1。
4.如权利要求3所述的路径跟随方法,其特征在于,获得代价值Q(sn,ai)的公式为:Q(sn,ai)=Rn+γ(max(Q(sn+1,ai)))。
5.如权利要求1所述的路径跟随方法,其特征在于,获得代价值Q(sn,ai)的步骤还包括:
检测当前栅格sn是否位于所述路径区域内,若是则执行获得当前收益Rn的步骤,若否则自起点栅格起重新遍历。
6.如权利要求1所述的路径跟随方法,其特征在于,遍历获得路径区域内每个栅格基于每个动作ai的代价值的步骤还包括:
实时检测经过的栅格位置,当经过的栅格位置超出路径区域,则自起点栅格起重新遍历。
7.如权利要求1所述的路径跟随方法,其特征在于,所述自起点栅格起遍历获得路径区域内每个栅格基于每个动作ai的代价值的步骤包括:
自起点栅格起执行动作集合中的任一动作到达当前栅格sn;
获得当前栅格sn基于每个动作ai的代价值Q(sn,ai);以及
将当前栅格sn作为起点栅格,遍历获得路径区域内每个栅格基于每个动作ai的代价值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811191784.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:控制机器人的方法
- 下一篇:基于多光谱成像技术的人工智能控制方法及装置