[发明专利]基于示教学习的决策树行为决策算法有效
申请号: | 201710687194.0 | 申请日: | 2017-08-11 |
公开(公告)号: | CN107479547B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 王祝萍;邢文治;张皓;陈启军 | 申请(专利权)人: | 同济大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 北京国坤专利代理事务所(普通合伙) 11491 | 代理人: | 黄耀钧 |
地址: | 201800 上海市嘉定区曹*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于示教学习的决策树行为决策算法,主要解决现有技术中存在的现有决策算法不能同时兼顾综合复杂的场景和稳定的要求的问题。该一种基于示教学习的决策树行为决策算法包括步骤为:存储示教轨迹的状态转移规律;求取状态转移频率矩阵和状态转移概率矩阵;构建奖励;决策树对即将产生的动作进行评估;更新转移频率矩阵与状态转移概率矩阵;重复上述过程至评估通过。通过上述方案,本发明达到了无人驾驶行为决策应的最大合理性和安全性目的。 | ||
搜索关键词: | 基于 教学 决策树 行为 决策 算法 | ||
【主权项】:
一种基于示教学习的决策树行为决策算法,其特征在于,包括如下步骤:(a)用行为的状态转移频率矩阵和状态转移概率矩阵来描述示教学习中的示教规律,存储示教轨迹的状态转移规律;(b)根据步骤(a)求取状态转移频率矩阵和状态转移概率矩阵;(c)根据状态转移频率构建奖励;(d)转移概率矩阵输出即将进行的选择动作时,决策树根据步骤(b)对状态转移概率矩阵即将产生的动作进行评估,评估通过,则执行状态转移,评估不通过,则执行步骤(e);(e)根据步骤(b)和(c)通过Actor‑Critic算法更新转移频率矩阵与状态转移概率矩阵;(f)重复步骤(d)和(e)至评估通过。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710687194.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车安全部件看门狗电路
- 下一篇:一种AGV小车控制系统