[发明专利]一种基于场景区分的深度强化学习训练方法及系统在审

专利信息
申请号: 201910913368.X 申请日: 2019-09-25
公开(公告)号: CN110795821A 公开(公告)日: 2020-02-14
发明(设计)人: 董舒 申请(专利权)人: 的卢技术有限公司
主分类号: G06F30/20 分类号: G06F30/20;G06K9/00;G06N3/04;G06N3/08
代理公司: 32272 南京禹为知识产权代理事务所(特殊普通合伙) 代理人: 王晓东
地址: 211103 江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于场景区分的深度强化学习训练方法及系统,包括以下步骤,将测试车辆接入仿真环境中并随意行驶;数据采集模块收集所述仿真环境中不同位置的街道图像数据集;利用U‑net网络模块对进行语义分割的训练;识别模块在线识别不同的道路情况;在不同的场景中分别设定符合各个场景的Reward值,分别进行针对性的训练;训练完成后模型部署使用。本发明的有益效果:通过减少算法模型学习如何区分各个场景的时间,来减少基于车辆行驶仿真软件中数据进行算法训练时间,可以快速验证车辆辅助驾驶/自动驾驶,能够明显降低算法模型在低效率探索上花费的时间,从而大大降低开发时间,提高训练性能。
搜索关键词: 场景 算法模型 数据采集模块 图像数据集 测试车辆 车辆行驶 仿真环境 仿真软件 辅助驾驶 接入仿真 强化学习 算法训练 网络模块 训练性能 语义分割 在线识别 自动驾驶 验证 行驶 街道 部署 探索 开发 学习
【主权项】:
1.一种基于场景区分的深度强化学习训练方法,其特征在于:包括以下步骤,/n将测试车辆接入仿真环境中并随意行驶;/n数据采集模块(100)收集所述仿真环境中不同位置的街道图像数据集;/n利用U-net网络模块(200)对采集到的所述图像数据集进行语义分割的训练,分别提取所述仿真环境中分割体并对所述分割体设置上不同的属性;/n识别模块(300)利用训练好的所述U-net网络模块(200)在线得到车辆当前由所述数据采集模块(100)得到图像中所包含的分割信息,在线识别不同的道路情况;/n深度强化学习网络的DDPG模块(400)根据所述识别模块(300)识别的道路情况,对车辆行驶的场景进行区分,并在不同的场景中分别设定符合各个场景的Reward值,分别进行针对性的训练;/n训练完成后模型部署使用,对车辆的辅助驾驶或自动驾驶进行仿真验证。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于的卢技术有限公司,未经的卢技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910913368.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top