[发明专利]基于Unity3D和深度增强学习的智能无人农用驾驶训练方法在审

申请号：	201810980718.X	申请日：	2018-08-27
公开（公告）号：	CN108984275A	公开（公告）日：	2018-12-11
发明（设计）人：	张玉成;万忠政;胡晓星;李莹玉	申请（专利权）人：	洛阳中科龙网创新科技有限公司
主分类号：	G06F9/455	分类号：	G06F9/455;G06N3/04
代理公司：	洛阳公信知识产权事务所(普通合伙) 41120	代理人：	宋晨炜
地址：	471000 河南省洛阳市***	国省代码：	河南;41
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	场景农田参量卷积神经网络环境参量驾驶训练随机环境训练智能智能体操作过程仿真操作随机生成学习算法智能参量化构建驾驶学习重复
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于Unity3D和深度增强学习的智能无人农用驾驶训练方法，其特征在于：包括如下步骤：

步骤1、在Unity3D中建立经典农田场景，经典农田场景中包括多种环境参量；

步骤2、由驾驶员基于经典农田场景进行仿真操作，并将操作过程参量化，得到操作参量；

步骤3、根据环境参量和操作参量构建卷积神经网络；

步骤4、对卷积神经网络进行预训练，得到预训练智能体；

步骤5、随机生成动态农田场景，并且在动态农田场景中加入随机环境参量；

步骤6、将预训练智能体投入动态农田场景中，利用深度增强学习算法进行自我训练，得到强化智能体；

步骤7、在动态农田场景中，提升部分随机环境参量的频率，对强化智能体进行重复训练。

2.如权利要求1所述的基于Unity3D和深度增强学习的智能无人农用驾驶训练方法，其特征在于：所述步骤1中，环境参量包括天气、地貌、场景和操作规范。

3.如权利要求1所述的基于Unity3D和深度增强学习的智能无人农用驾驶训练方法，其特征在于：所述步骤2中，操作参量包括油门动作、刹车动作和方向盘动作。

4.如权利要求1所述的基于Unity3D和深度增强学习的智能无人农用驾驶训练方法，其特征在于：所述步骤3中，以环境参量作为卷积神经网络的输入，并且记为X，以操作参量作为卷积神经网络的输出，并且记为y，将驾驶员操作数据记为t，则卷积神经网络的平方误差为

5.如权利要求4所述的基于Unity3D和深度增强学习的智能无人农用驾驶训练方法，其特征在于：所述步骤4中，对卷积神经网络进行预训练的方法包括：

步骤4.1、利用平方误差E根据链式法则计算卷积神经网络权重w的偏导数，具体方法为

其中o为神经元的输出，net为神经元的输入；

步骤4.2、引入学习速率α，根据平方误差和权重的偏导数对权重w进行更新，具体方法为

6.如权利要求5所述的基于Unity3D和深度增强学习的智能无人农用驾驶训练方法，其特征在于：所述步骤5中，随机环境参量还包括移动障碍物、天气变化和交通限制。

7.如权利要求6所述的基于Unity3D和深度增强学习的智能无人农用驾驶训练方法，其特征在于：所述步骤6中，利用深度增强学习算法进行自我训练的方法包括：

步骤6.1、构建策略网络，以随机环境参量作为策略网络的输入，以智能体为了应对随机环境参量做出的操作作为输出；

步骤6.2、在策略网络中加入奖励机制；

步骤6.3、依照预训练模型中的卷积神经网络结构设置Actor网络和Critic网络；

步骤6.4、通过Ornstein-Uhlenbeck过程加入随机参数；

步骤6.5、通过经验回放对Actor网络进行更新。

8.如权利要求7所述的基于Unity3D和深度增强学习的智能无人农用驾驶训练方法，其特征在于：所述步骤6.1中，策略网络表示为π_θ(s,α)＝P[α|s,θ]，其中s为当前状态，α为所采取的行为，θ为策略参数。

9.如权利要求8所述的基于Unity3D和深度增强学习的智能无人农用驾驶训练方法，其特征在于：所述步骤6.2中，引入衰减系数γ，r为每个状态的奖励值，总的奖励机制表示为R＝r₁+γ²r₂+......γⁿr_n。

10.如权利要求9所述的基于Unity3D和深度增强学习的智能无人农用驾驶训练方法，其特征在于：所述步骤6.4中，通过Ornstein-Uhlenbeck过程加入随机参数的方法表示为dx_t＝θ(μ-x_t)dt+σdW_t，其中的θ表示变量向均值变化的速度，μ表示均值，σ为过程的自由度，x和W代表过程作用的控制量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于洛阳中科龙网创新科技有限公司，未经洛阳中科龙网创新科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810980718.X/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F9-00 程序控制装置，例如，控制器
G06F9-02 .应用有线连接的，例如，插头板
G06F9-04 .应用仅含程序指令的记录载体的
G06F9-06 .应用存入的程序的，即应用处理设备的内部存储来接收程序并保持程序的
G06F9-22 ..微控制或微程序装置
G06F9-30 ..执行机器指令的装置，例如指令译码

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于Unity3D和深度增强学习的智能无人农用驾驶训练方法在审

专利文献下载