[发明专利]一种基于经验控制的多参数机器人实时行为校正方法有效
申请号: | 201811063090.3 | 申请日: | 2018-09-12 |
公开(公告)号: | CN109249393B | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 毛新军;黄裕泓;杨硕;刘哲 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16 |
代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 周长清 |
地址: | 410073 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 经验 控制 参数 机器人 实时 行为 校正 方法 | ||
1.一种基于经验控制的多参数机器人实时行为校正方法,其特征在于,包括:
基于迭代仿真采集的多组状态信息,通过离线学习的方式生成机器人的参数化控制函数;所述状态信息是连接离线学习控制函数与实时机器人行为调整两个主要部分的桥梁;所述状态信息通过实际任务行为和预期任务行为之间的差异来表示;结合控制参数和偏差,状态信息表示为公式(1)和公式(2)数据集中的向量:
P=[V AS]T (1)
X=[Dreal Daim V AC l]T (2)
其中公式(1)展示着控制器参数是由速度V和倾角的变化步长AS确定;在公式(2)中,定义了多个输入;输入包括两种变量,即当前时刻的行为和过去时间的变量;路径和机器人位置之间的偏差l是当前时刻的行为;在公式(2)中,机器人的实际方向Dreal,期望的方向Daim,速度V和来自控制器的实际转角AC是前一时间的变量;它们是机器人的控制条件,会影响当前的行为l;
基于离线学习的参数化控制函数,构建机器人实时运行过程中的自适应调整模型,利用模型对机器人的偏差行为进行校正;
根据外部环境变化,自主地从多个控制参数中选择最为敏感的参数控制机器人的行为更新选择。
2.根据权利要求1所述的基于经验控制的多参数机器人实时行为校正方法,其特征在于,采用离线学习的方式生成机器人的参数化控制函数,参数模型函数将由经验数据离线生成;机器人以不同参数迭代运行,以收集机器人状态信息作为数据集的经验数据;借助经验数据,将函数拟合应用于提取数据集中参数之间的潜在规则以及来自它们的影响,然后为每个参数创建模型函数。
3.根据权利要求1所述的基于经验控制的多参数机器人实时行为校正方法,其特征在于,包括实时对机器人行为进行自适应调整,机器人的行为根据实时机器人状态信息进行自适应调整;传感器监视器使用传感器收集状态信息并确定如何更新机器人的参数;之后,机器人使用离线学习的参数模型函数来调整多个参数;如果机器人行为产生不可接受的偏差,机器人的行为将会改变否则将维持原有控制参数模型。
4.根据权利要求1所述的基于经验控制的多参数机器人实时行为校正方法,其特征在于,包括进行多参数更新的过程,即一次选择敏感参数进行更新,而其他参数保持不变;这个选择将通过学习的参数化函数对控制参数的偏微分函数结合实时状态信息进行。
5.根据权利要求1—4中任意一项所述的基于经验控制的多参数机器人实时行为校正方法,其特征在于,还包括离线生成控制模型,具体包括以下步骤:
S1:控制函数模型建模;
S2:实现函数拟合的数学模型;
S3:离线学习生成控制模型算法。
6.根据权利要求5所述的基于经验控制的多参数机器人实时行为校正方法,其特征在于,所述步骤S1中建模为下式(3):
在式(3)中,Dt-1=[Dreal Daim]T表示方向信息,XE表示公式(2)中输入的拓展;由于希望在微分时显示Dt-1和AC,所以该方程具有用于方向信息Dt-1的二阶模型和用于AC的三角函数;由于有多个参数,控制器需要超过一个参数模型的功能,以便每个参数都有自己的规则生效。
7.根据权利要求1—4中任意一项所述的基于经验控制的多参数机器人实时行为校正方法,其特征在于,包括实时更新多个控制参数,在机器人实时运行中,传感器监视机器人的行为以生成具有偏差l的状态信息,用于解释机器人行为偏移;如果偏差l不可接受,机器人应该改变控制器参数,然后使用来自经验的模型函数进行行为更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811063090.3/1.html,转载请声明来源钻瓜专利网。