[发明专利]一种基于Dyna框架的混合智能路径规划方法及装置在审

专利信息
申请号: 202110353938.1 申请日: 2021-04-06
公开(公告)号: CN113074738A 公开(公告)日: 2021-07-06
发明(设计)人: 周春辉;王理征;朱曼;文元桥;黄亚敏;陶威 申请(专利权)人: 武汉理工大学
主分类号: G01C21/20 分类号: G01C21/20;G06N20/20
代理公司: 武汉智嘉联合知识产权代理事务所(普通合伙) 42231 代理人: 赵泽夏
地址: 430070 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 dyna 框架 混合 智能 路径 规划 方法 装置
【权利要求书】:

1.一种基于Dyna框架的混合智能路径规划方法,其特征在于,包括以下步骤:

S1、根据马尔科夫决策过程构建决策模型;

S2、采用栅格法对船舶航行环境建立环境模型,确定初始位置及目标位置;

S3、根据船舶当前位置及目标位置,采用Dyna-H算法对所述决策模型进行更新,并根据船舶当前位置及目标位置及决策模型对船舶当前可能的动作a分别进行评估,确定当前最优动作;

S4、执行当前最优动作,并重复S3直到到达目标位置,生成最优路径。

2.如权利要求1所述的基于Dyna框架的混合智能路径规划方法,其特征在于,步骤S1具体包括:

马尔可夫决策由(S,A,r,Psa)组成,其中,S={s1,s2,L,st}是状态空间,A={a1,a2,L,at}是动作空间,at∈A表示在t时刻执行的动作,r是奖励函数,Psa是状态转移函数,它满足马尔可夫属性:Psa(st+1|s1,a1,L,st,at)=Psa(st+1|st,at),st为t时刻状态,at为t时刻所选动作;

强化学习的回报函数Gt表示从t时刻开始后的奖励折扣和,回报函数表达式为:其中,折扣因子γ∈(0,1)。

3.如权利要求1所述的基于Dyna框架的混合智能路径规划方法,其特征在于,步骤S2包括:

S21、将船舶航行水域用大小相同的栅格进行均匀划分;

S22、判断栅格是否被碍航物占据,将栅格分为无障碍物的自由栅格和被碍航物占据的障碍栅格,船舶航行的环境由自由栅格和障碍栅格构成;

S23、确定船舶的初始位置及目标位置。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110353938.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top