[发明专利]双足机器人步态控制方法、控制装置有效
| 申请号: | 202110648071.2 | 申请日: | 2021-06-10 |
| 公开(公告)号: | CN113467235B | 公开(公告)日: | 2022-09-02 |
| 发明(设计)人: | 赵明国;陈崴 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G05B13/04 | 分类号: | G05B13/04 |
| 代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 董永辉;曹素云 |
| 地址: | 10008*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 机器人 步态 控制 方法 装置 | ||
1.一种双足机器人步态控制方法,其特征在于,在仿真环境中建立双足机器人完整模型,所述完整模型包括躯干、双腿、双足,躯干与双腿间通过髋关节连接,双腿与双足间通过踝关节连接,所述仿真环境为平面地形,所述方法包括模仿学习和强化学习两个阶段,其中,
所述模仿学习包括:
步骤S1,建立双足机器人简化模型,所述简化模型包括躯干和双腿,每条腿都通过髋关节与所述躯干连接,每条腿上各有沿腿长度方向的驱动力F和绕髋关节转动的力矩τ;
步骤S2,重复从仿真环境中读取所述完整模型的当前状态,并根据所述完整模型的当前状态及动作目标,对所述简化模型求解轨迹规划问题和任务空间控制,得到完整模型与各当前状态对应的各驱动关节目标位置,将所述完整模型的各当前状态及对应的各驱动关节目标位置一一对应,组成模仿学习数据集;
步骤S3,利用所述模仿学习数据集对第一神经网络进行监督训练,所述第一神经网络的输入为完整模型的状态,输出为各驱动关节目标位置;
步骤S4,将经过训练的第一神经网络用于控制所述完整模型行走,直到所述完整模型出现不稳定,计算不稳定时的轨迹下所述完整模型的状态与动作目标之间的均方误差,
若所述均方误差不收敛,则提取所述不稳定时的轨迹下的所有状态和动作目标,根据所述不稳定时的轨迹下的状态及动作目标,对所述简化模型求解轨迹规划问题和任务空间控制,得到所述完整模型在所述不稳定时的轨迹下的各驱动关节目标位置,将所述完整模型在所述不稳定时轨迹下的状态及对应的各驱动关节目标位置一一对应合并到模仿学习数据集中,重复步骤S3和S4,
若所述均方误差值收敛,则保存该模仿学习过程所有轨迹中均方误差最小的一次对应的神经网络参数作为最佳参数;
所述强化学习包括:
构建第二神经网络,所述第二神经网络与第一神经网络结构相同,并将第二神经网络的参数初始化为第一神经网络中得到的所述最佳参数;
将所述平面地形更换为真实模拟地形,采用强化学习算法训练第二神经网络,其中输入和输出均和第一神经网络相同,奖励函数设置为所述完整模型的状态与动作目标之间的均方误差;
强化学习收敛后,利用强化学习后的第二神经网络控制双足机器人行走。
2.根据权利要求1所述的双足机器人步态控制方法,其特征在于,
所述简化模型采用SLIP模型,其中躯干的质量m和惯量I采用与实际机器人躯干相同的质量和惯量,忽略双腿的质量和惯量,双腿刚度k和阻尼b的取值与实际机器人双腿等效刚度和阻尼相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110648071.2/1.html,转载请声明来源钻瓜专利网。





