[发明专利]一种动态随机环境的路径规划方法和装置在审
申请号: | 201811329446.3 | 申请日: | 2018-11-09 |
公开(公告)号: | CN109343532A | 公开(公告)日: | 2019-02-15 |
发明(设计)人: | 黄兵明;廖军;王泽林 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供一种动态随机环境的路径规划方法和装置,涉及计算机信息处理领域,能够在动态随机环境下找到最优路径。该方法包括:定义特征向量空间,将初始节点的状态值赋予初始中间量,根据该初始中间量,获取初始节点的运行动作、前进节点的状态值和运行动作,同时依据基于CMAC的递归最小二乘Q强化学习算法,对中间参数进行更新;然后将前进节点的状态值赋予初始中间量后重复上述流程,直至初始中间量和终止节点的状态值相同时,重复上述从初始节点的状态值赋予初始中间量开始的流程;依据递归最小二乘解公式计算权值行向量的确定值,以获取目标特征向量空间,根据目标特征向量空间和权利向量的确定值获取最终Q值表,以得到最优路径。 | ||
搜索关键词: | 中间量 初始节点 随机环境 方法和装置 路径规划 运行动作 最优路径 递归 赋予 计算机信息处理 目标特征向量 强化学习算法 特征向量空间 最小二乘解 定义特征 公式计算 获取目标 向量空间 中间参数 终止节点 最小二乘 行向量 重复 向量 更新 | ||
【主权项】:
1.一种动态随机环境的路径规划方法,其特征在于,包括:获取资格迹的初始值、构造列向量的初始值、构造矩阵的初始值、初始节点的状态值和终止节点的状态值;所述初始节点的状态值包括所述初始节点的空间坐标,所述终止节点的状态值包括所述终止节点的空间坐标;根据小脑神经网络CMAC隐含层的权值行向量的初始值和所述CMAC的激活函数,构建所述动态随机环境的特征向量空间;将所述初始节点的状态值赋予初始中间量;根据所述初始中间量,获取所述初始节点的运行动作、前进节点的状态值和前进节点的运行动作;根据所述初始中间量、所述资格迹的初始值、所述特征向量空间、所述构造列向量的初始值、所述构造矩阵的初始值、所述初始节点的运行动作、所述前进节点的状态值和所述前进节点的运行动作,依据基于CMAC的递归最小二乘Q强化学习算法,对所述资格迹的初始值、所述构造列向量的初始值和所述构造矩阵的初始值均进行更新;将所述前进节点的状态值赋予所述初始中间量后,根据所述初始中间量,获取所述初始节点的运行动作、前进节点的状态值和前进节点的运行动作;所述初始节点的运行动作与所述前进节点的状态值一一对应;当确定所述初始中间量和所述终止节点的状态值相同时,将所述初始节点的状态值赋予所述初始中间量后,根据所述初始中间量,获取所述初始节点的运行动作、前进节点的状态值和前进节点的运行动作;当确定所有所述初始中间量中存在预设个数个初始中间量与所述终止节点的状态值相同时,根据当前时刻的所述构造矩阵的初始值和当前时刻的所述构造列向量的初始值,依据递归最小二乘解公式计算所述权值行向量的确定值;根据所述权值行向量的确定值对所述特征向量空间进行更新,以获取目标特征向量空间;根据所述权值行向量的确定值和所述目标特征向量空间,依据预设Q值计算公式计算最终Q值表;根据所述最终Q值表确定所述动态随机环境中所述初始节点和所述终止节点之间的最优路径。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811329446.3/,转载请声明来源钻瓜专利网。