[发明专利]一种基于对抗式强化学习的安全场景加速测试方法及系统在审
申请号: | 202210569241.2 | 申请日: | 2022-05-24 |
公开(公告)号: | CN115292154A | 公开(公告)日: | 2022-11-04 |
发明(设计)人: | 丁延超;李茹;马育林;王光玮 | 申请(专利权)人: | 苏州观瑞汽车技术有限公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06F30/27;G06N3/08;G06N20/00 |
代理公司: | 北京方圆嘉禾知识产权代理有限公司 11385 | 代理人: | 王月松 |
地址: | 215137 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对抗 强化 学习 安全 场景 加速 测试 方法 系统 | ||
本发明涉及一种基于对抗式强化学习的安全场景加速测试方法及系统,方法包括:获取自动驾驶被测对象和预设的测试用例库;基于机器学习的代理仿真模型,设计可均衡开发与探索的采集函数;基于所述自动驾驶被测对象,根据所述采集函数对所述测试用例库进行搜索,得到适合所述自动驾驶被测对象的测试集;所述测试集包括多个驾驶场景;基于对抗学习的方法,根据所述驾驶场景和所述自动驾驶被测对象进行测试,得到轨迹分布;根据所述轨迹分布适时调整所述测试集,以实现不同安全性的驾驶场景的加速测试。本发明能够提高自动驾驶车辆测试的安全程度和测试效率。
技术领域
本发明涉及车辆自动驾驶测试技术领域,特别是涉及一种基于对抗式强化学习的安全场景加速测试方法及系统。
背景技术
近年来,各类自动驾驶仿真测试软件层出不穷,尤其是许多进军自动驾驶行业的互联网公司,各自都开发了仿真软件以支持自动驾驶技术研发,典型的如百度Apollo、腾讯TAD Sim、微软AirSim、Waymo的CarCraft、丰田/英特尔的CARLAO、西门子PreScan等。各款仿真软件实现的功能多种多样、使用方法不一。
目前的自动驾驶仿真测试平台测试效率低、置信度不足,车辆行驶环境复杂度高、随机性强,现有测试场景难以反映真实的高复杂度、随机性强的交通环境,未能形成自动驾驶系统多层级、多难度等级的高置信场景构建方法,同时缺乏对应测试目标的场景快速搜索方法,测试效率低、置信度不足,需要构建适应不同等级要求的高效高置信场景构建理论与加速测试方法。
实现测试对象和测试用例的高效匹配,形成满足异构被测对象特性的个性化测试方法是实现加速测试的核心。强化学习已经用于场景加速测试中,但是目前的常用的学习未解决自动驾驶车辆要求的高安全性问题。
发明内容
为了克服现有技术的不足,本发明的目的是提供一种基于对抗式强化学习的安全场景加速测试方法及系统。
为实现上述目的,本发明提供了如下方案:
一种基于对抗式强化学习的安全场景加速测试方法,包括:
获取自动驾驶被测对象和预设的测试用例库;
基于机器学习的代理仿真模型,设计可均衡开发与探索的采集函数;
基于所述自动驾驶被测对象,根据所述采集函数对所述测试用例库进行搜索,得到适合所述自动驾驶被测对象的测试集;所述测试集包括多个驾驶场景;
基于对抗学习的方法,根据所述驾驶场景和所述自动驾驶被测对象进行测试,得到轨迹分布;
根据所述轨迹分布适时调整所述测试集,以实现不同安全性的驾驶场景的加速测试。
优选地,所述测试用例库的确定方法具体为:
基于预设的自动驾驶的测试目标和通用测试场景数据格式,将场景参数划分为环境参数、路况参数和对象参数;所述测试目标包括设计运行域、动态驾驶任务和交规;
根据测试场景中的要求确定参数约束集,并获取所述测试场景中的未覆盖组合集;
对所有的所述场景参数进行取值,得到场景参数组合集;
根据所述参数约束集对所述场景参数组合集进行参数取值,得到参数取值组合集;
对取值过程进行重复迭代,以解析出参数空间;所述参数空间中包括所述未覆盖组合集;
基于组合测试算法,根据所述参数空间生成多个所述测试用例;所述测试用例库由多个所述测试用例构成。
优选地,所述根据测试场景中的要求确定参数约束集,包括:
将所述测试场景中的要求转化为多个约束;
根据所述约束得到初始约束集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州观瑞汽车技术有限公司,未经苏州观瑞汽车技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210569241.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钢板条煨弯器及钢板条煨弯方法
- 下一篇:快速去除挥发性溶剂的系统