[发明专利]复杂场景下的无人驾驶汽车决策系统及决策方法在审
| 申请号: | 202210490835.4 | 申请日: | 2022-05-07 |
| 公开(公告)号: | CN114889644A | 公开(公告)日: | 2022-08-12 |
| 发明(设计)人: | 罗玉涛;梁伟强 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | B60W60/00 | 分类号: | B60W60/00;G06N3/04;G06N3/08 |
| 代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 郑秋松 |
| 地址: | 510640 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 复杂 场景 无人驾驶 汽车 决策 系统 方法 | ||
1.一种复杂场景下的无人驾驶汽车决策系统,其特征在于,包括决策模块、自学习模块;
所述决策模块、所述自学习模块均分别为神经网络,决策模块与自学习模块相互连接;决策模块与自学习模块的输入均分别为无人驾驶场景的环境分层特征,输出均分别为相应无人驾驶的决策动作;
决策模块用于对已经训练过的无人驾驶场景的环境分层特征进行学习得到相应无人驾驶的决策动作;
自学习模块用于对没有训练过的无人驾驶场景的环境分层特征进行训练得到相应无人驾驶的决策动作,并将训练过程中产生的与环境分层特征对应的权重参数更新到决策模块;
所述环境分层特征包括无人驾驶场景的静态特征、软约束特征、动态特征,所述权重参数包括静态权重、软约束权重、动态权重,所述决策动作包括目标车速、目标位置。
2.根据权利要求1所述复杂场景下的无人驾驶汽车决策系统,其特征在于,决策模块包括元网络、强化学习决策网络;
所述元网络与所述强化学习决策网络相互连接;
元网络用于学习已经训练过的无人驾驶场景的环境分层特征得到相应的权重参数,并将权重参数作为强化学习决策网络进行学习的约束条件;
强化学习决策网络用于根据环境分层特征,在约束条件下学习得到相应无人驾驶场景的决策动作。
3.根据权利要求2所述复杂场景下的无人驾驶汽车决策系统,其特征在于,元网络包括静态权重网络、软约束权重网络、动态权重网络;
所述静态权重网络、所述软约束权重网络、所述动态权重网络均分别为多层全连接神经网络,静态权重网络、软约束权重网络、动态权重网络分别与强化学习决策网络连接;
静态权重网络用于根据已经训练过的无人驾驶场景的静态特征学习得到静态权重;
软约束权重网络用于根据已经训练过的无人驾驶场景的软约束特征学习得到软约束权重;
动态权重网络用于根据已经训练过的无人驾驶场景的动态特征学习得到动态权重。
4.根据权利要求2所述复杂场景下的无人驾驶汽车决策系统,其特征在于,强化学习决策网络包括动作网络和评价网络;
所述动作网络与元网络连接,所述评价网络与动作网络连接,动作网络和评价网络均分别为多层全连接的神经网络;
动作网络用于根据已经训练过的无人驾驶场景的环境分层特征在约束条件下进行学习得到初始的决策动作;
动作网络包括静态层网络、软约束层网络、动态层网络;所述静态层网络、软约束层网络、动态层网络分别与元网络连接;静态层网络、软约束层网络、动态层网络依次连接,静态层网络、软约束层网络、动态层网络的输入分别为静态特征、软约束特征、动态特征,静态层网络、软约束层网络、动态层网络的约束条件分别为静态权重、软约束权重、动态权重;
评价网络用于对动作网络学习得到的初始的决策动作进行评价得到最终的决策动作。
5.根据权利要求1所述复杂场景下的无人驾驶汽车决策系统,其特征在于,自学习模块包括孪生元网络、孪生强化学习决策网络、已学习场景库;
所述已学习场景库与孪生元网络连接;已学习场景库用于识别没有训练过的无人驾驶场景的环境分层特征与已经训练过的无人驾驶场景的环境分层特征之间的差异特征;
所述孪生元网络与所述孪生强化学习决策网络相互连接,孪生元网络与元网络相互连接;
孪生元网络用于学习差异特征得到相应的权重参数,并将权重参数作为孪生强化学习决策网络进行学习的约束条件,同时将权重参数输入决策模块中更新元网络的权重参数;
孪生强化学习决策网络用于根据没有训练过的无人驾驶场景的环境分层特征,在约束条件下学习得到相应无人驾驶场景的决策动作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210490835.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种食管环咽肌球囊扩张管
- 下一篇:交叉式换热结构及换热器





