[发明专利]一种考虑意图及个体操作习惯的智能避障方法有效
| 申请号: | 202210830915.X | 申请日: | 2022-07-15 |
| 公开(公告)号: | CN115202351B | 公开(公告)日: | 2023-04-25 |
| 发明(设计)人: | 王义娜;张德龙;刘赛男;曹晨;杨俊友;周勃 | 申请(专利权)人: | 沈阳工业大学 |
| 主分类号: | G05D1/02 | 分类号: | G05D1/02 |
| 代理公司: | 沈阳亚泰专利商标代理有限公司 21107 | 代理人: | 邵明新 |
| 地址: | 110870 辽宁省沈阳*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 考虑 意图 个体 操作 习惯 智能 方法 | ||
1.一种考虑意图及个体操作习惯的智能避障方法,其特征在于:包括以下步骤:
步骤1、轮椅机器人在避障时,考虑驾驶者的行驶意图;
步骤2、根据驾驶者的操作习惯进行自学习,动态调整自身在避障状态时的默认转向幅度;
步骤3、构建出危险度评价标准,对轮椅机器人的强化学习进行安全约束;
采用超声波传感器获取障碍物的距离信息;建立自动避障模糊推理以确定障碍物的距离与轮椅机器人自动避障方向角βa之间的关系;
轮椅机器人根据驾驶者操作指令,记指令方向为βe;轮椅机器人所执行的最终行驶方向βf根据操作权重w来决定多大程度遵循驾驶者的指令方向,如公式(1):
βf=βew+βa(1-w)(1)
基于驾驶者行驶意图与自动避障方向角的偏差βb及轮椅机器人的当前行驶速度vr来确定操作权重w,基于模糊推理,以βb与vr为前件,以w为后件建立其输入输出关系;
βb=|βa-βe|(2)
其中,vx,vy分别为轮椅机器人当前沿x轴和y轴方向的分速度,可以基于轮椅机器人的运动学,由四个轮子的速度来求取,如下:
其中,θ为轮椅机器人当前的方向角;l为轮椅机器人中心到每个轮子的距离;v1,v2,v3,v4为四个轮子的当前速度;
采集一个避障周期内驾驶者操作指令方向βe的离散数列,将βe的离散数列进行分类,将数据中偏向障碍物方向的角度记为θNk(k=1,2,...,n),远离障碍物的意图角度记为θFk,并做归一化处理得到操作习惯的特征值C,如公式(5)所示:
当操作习惯特征值C为正数,则说明驾驶者认为避障行驶过程中距离障碍物过近,所以在该避障周期中采取偏离障碍物的操作指令对轮椅机器人的行驶状态进行补偿。
2.根据权利要求1所述的方法,其特征在于:建立强化学习奖励函数:
将轮椅机器人最终行驶方向βf的影响因素中,增添操作权重补偿项s,如公式(6)所示:
βf=βe(w+s)+βa[1-(w+s)](6)
将操作习惯特征值转化成奖励函数,如公式(7)所示:
式中,操作权重补偿项s的值初始为0,C的值可正可负,确定出轮椅机器人经过一个避障周期后的奖励值Gt;操作权重补偿项s的值依照奖励值Gt,在若干避障周期中不断迭代学习。
3.根据权利要求2所述的方法,其特征在于:建立人机交互强化学习模型:
将轮椅机器人视作强化学习模型当中的智能体,将一个避障周期的行驶视为智能体的一次动作,用奖励函数Gt作为环境给予的奖励信号,对操作权重补偿项s的值进行迭代学习;如式(8)所示:
V(st)←V(st)+α[Gt-V(st)](8)
其中,V(st)就是指补偿项s的值,α为算法的学习率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳工业大学,未经沈阳工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210830915.X/1.html,转载请声明来源钻瓜专利网。





