[发明专利]一种基于场景区分的深度强化学习训练方法及系统在审
申请号: | 201910913368.X | 申请日: | 2019-09-25 |
公开(公告)号: | CN110795821A | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 董舒 | 申请(专利权)人: | 的卢技术有限公司 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 32272 南京禹为知识产权代理事务所(特殊普通合伙) | 代理人: | 王晓东 |
地址: | 211103 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于场景区分的深度强化学习训练方法及系统,包括以下步骤,将测试车辆接入仿真环境中并随意行驶;数据采集模块收集所述仿真环境中不同位置的街道图像数据集;利用U‑net网络模块对进行语义分割的训练;识别模块在线识别不同的道路情况;在不同的场景中分别设定符合各个场景的Reward值,分别进行针对性的训练;训练完成后模型部署使用。本发明的有益效果:通过减少算法模型学习如何区分各个场景的时间,来减少基于车辆行驶仿真软件中数据进行算法训练时间,可以快速验证车辆辅助驾驶/自动驾驶,能够明显降低算法模型在低效率探索上花费的时间,从而大大降低开发时间,提高训练性能。 | ||
搜索关键词: | 场景 算法模型 数据采集模块 图像数据集 测试车辆 车辆行驶 仿真环境 仿真软件 辅助驾驶 接入仿真 强化学习 算法训练 网络模块 训练性能 语义分割 在线识别 自动驾驶 验证 行驶 街道 部署 探索 开发 学习 | ||
【主权项】:
1.一种基于场景区分的深度强化学习训练方法,其特征在于:包括以下步骤,/n将测试车辆接入仿真环境中并随意行驶;/n数据采集模块(100)收集所述仿真环境中不同位置的街道图像数据集;/n利用U-net网络模块(200)对采集到的所述图像数据集进行语义分割的训练,分别提取所述仿真环境中分割体并对所述分割体设置上不同的属性;/n识别模块(300)利用训练好的所述U-net网络模块(200)在线得到车辆当前由所述数据采集模块(100)得到图像中所包含的分割信息,在线识别不同的道路情况;/n深度强化学习网络的DDPG模块(400)根据所述识别模块(300)识别的道路情况,对车辆行驶的场景进行区分,并在不同的场景中分别设定符合各个场景的Reward值,分别进行针对性的训练;/n训练完成后模型部署使用,对车辆的辅助驾驶或自动驾驶进行仿真验证。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于的卢技术有限公司,未经的卢技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910913368.X/,转载请声明来源钻瓜专利网。