[发明专利]基于改进的DQN算法的虚拟自动驾驶测试优化方法在审
| 申请号: | 202010458203.0 | 申请日: | 2020-05-27 |
| 公开(公告)号: | CN111625457A | 公开(公告)日: | 2020-09-04 |
| 发明(设计)人: | 叶剑;张晖;滕婷婷;宋智军;刘海青 | 申请(专利权)人: | 多伦科技股份有限公司 |
| 主分类号: | G06F11/36 | 分类号: | G06F11/36;G06N3/04;G06N3/08 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 211112 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 改进 dqn 算法 虚拟 自动 驾驶 测试 优化 方法 | ||
1.一种基于改进的DQN算法的虚拟自动驾驶测试优化方法,其特征在于,包括步骤如下:
步骤1:生成能够激活神经元的测试输入,分析深度神经网络逻辑的不同部分,生成真实驾驶场景的图像数据;
步骤2:对卷积神经网络的激活函数进行改进,构建一种分段的激活函数,采用构建的分段的激活函数来作为卷积神经网络全连接层的激活函数;
步骤3:采用Gabor滤波器代替卷积神经网络中的可训练的滤波器,将上述步骤1中生成的真实驾驶场景的图像数据和Gabor滤波器进行卷积,得到多个不同方向的图像特征,将得到的图像特征输入卷积神经网络中,经过计算后,得到一个新的特征图;通过上述步骤2中构建的分段的激活函数对得到的新的特征图进行映射;再利用Q-Learning算法来训练更新卷积神经网络的网络权重,得到训练模型,从而生成各种天气场景下的路况图像数据。
2.根据权利要求1所述的基于改进的DQN算法的虚拟自动驾驶测试优化方法,其特征在于,所述步骤1具体包括:DeepTest通过在种子图像上应用不同的图像变换合成模拟各种场景下的路况图像,从而激活自动驾驶汽车深度神经网络中的不同神经元集。
3.根据权利要求1所述的基于改进的DQN算法的虚拟自动驾驶测试优化方法,其特征在于,所述步骤2具体包括:基于改进的深度Q网络算法对卷积神经网络的激活函数进行改进,构建一种分段的激活函数。
4.根据权利要求3所述的基于改进的DQN算法的虚拟自动驾驶测试优化方法,其特征在于,所述卷积神经网络中的激活函数包括饱和非线性激活函数和不饱和非线性激活函数。
5.根据权利要求1所述的基于改进的DQN算法的虚拟自动驾驶测试优化方法,其特征在于,所述步骤2中构建的分段的激活函数记为Correct-ReLU函数,公式如下:
式中,x为神经元的输入,CR(x)为经激活函数非线性映射后神经元的输出。
6.根据权利要求1所述的基于改进的DQN算法的虚拟自动驾驶测试优化方法,其特征在于,所述步骤3具体包括:将真实驾驶场景的图像数据和Gabor滤波器卷积后得到的特征进行特征融合,利用主成分分析法进行降维处理,用降维后得到的特征作为CNN的输入;经过CNN中的卷积层、子采样层和全连接层的卷积、抽样计算后,得到一个新的特征图,通过构建的分段的激活函数对输出结果进行映射;再利用强化学习中的Q-Learning算法来训练更新网络权重,得到训练模型,以实现合成各种天气场景下的路况图像数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于多伦科技股份有限公司,未经多伦科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010458203.0/1.html,转载请声明来源钻瓜专利网。





