[发明专利]基于策略梯度在线学习算法的巡航控制系统及设计方法有效

申请号：	201910952171.7	申请日：	2019-10-30
公开（公告）号：	CN110615003B	公开（公告）日：	2020-09-18
发明（设计）人：	高炳钊;张羽翔;郭露露;陈虹	申请（专利权）人：	吉林大学
主分类号：	B60W50/00	分类号：	B60W50/00
代理公司：	长春吉大专利代理有限责任公司 22201	代理人：	崔斌
地址：	130012 吉***	国省代码：	吉林;22
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明属于汽车先进智能辅助驾驶系统设计及汽车安全技术领域，具体的说是一种基于策略梯度在线学习方法设计的巡航控制系统及方法。本发明将基于策略梯度的强化学习方法，针对车辆系统控制问题的需求，设计了一种基于策略梯度在线学习方法设计的自适应巡航控制系统。该系统适用于L2级别自动驾驶车辆，目标是通过在线学习有效提高系统对不同环境的适应能力，在不同环境下得到一致的控制性能。本发明进一步地对学习框架进行改进，以提高学习算法的效率及稳定性，使得在实际问题中，车辆可以快速地适应变化的环境。
搜索关键词：	基于策略梯度在线学习算法巡航控制系统设计方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于策略梯度在线学习算法的巡航控制系统，其特征在于，该系统包括智能感知信号处理模块(A)、模式切换模块(B)、学习模块(C)和车辆执行控制模块(D)；/n所述智能感知信号处理模块(A)，用于获得当前车辆和前方车辆行驶状态信息并进行信号处理；/n所述模式切换模块(B)，用于对学习系统中不同模式进行切换，基于规则方法设计模式切换策略；/n所述学习模块(C)，用于学习跟车策略并根据环境进行在线更新；/n所述车辆执行控制模块(D)，用于对实际控制量进行跟踪控制，采用双层前馈加反馈PID控制器实现；/n所述智能感知信号处理模块(A)与模式切换模块(B)、学习跟车模块(C)以及执行控制模块D相连；所述模式切换模块(B)与学习跟车模块(C)相连；所述学习跟车模块(C)与执行控制模块(D)相连。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于吉林大学，未经吉林大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910952171.7/，转载请声明来源钻瓜专利网。

上一篇：用于控制自主驾驶的装置和方法
下一篇：用于控制与安全相关的过程的方法和设备，以及车辆

同类专利

专利分类

B 作业；运输

B60 一般车辆
B60W 不同类型或不同功能的车辆子系统的联合控制；专门适用于混合动力车辆的控制系统；不与某一特定子系统的控制相关联的道路车辆驾驶控制系统
B60W50-00 不与某一特定子系统的控制相关联的道路车辆驾驶控制的控制系统的零部件
B60W50-02 .控制系统故障时确保安全的，例如，通过诊断、防止或修理故障
B60W50-04 .监测控制系统的效能的
B60W50-06 .改善控制系统的动态响应，例如，改善调节速度或避免振荡或过冲
B60W50-08 .在驾驶员与控制系统之间的人机交流
B60W50-10 ..驾驶员请求或命令的译码

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于策略梯度在线学习算法的巡航控制系统及设计方法有效

专利文献下载