[发明专利]基于确定学习理论的机械臂通用控制方法有效
申请号: | 201110148179.1 | 申请日: | 2011-06-03 |
公开(公告)号: | CN102289204A | 公开(公告)日: | 2011-12-21 |
发明(设计)人: | 吴玉香;王聪 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 确定 学习理论 机械 通用 控制 方法 | ||
技术领域
本发明涉及一种机械臂通用控制方法,具体是指基于确定学习理论的机械臂闭环动态学习与跟踪控制方法。
背景技术
随着科学技术的高度发展,机器人系统的应用领域越来越广泛,如工业、农业、医疗等。随着机器人系统的广泛应用,智能化成为其发展的一个重要方向。为系统参数完全未知的机械臂设计通用控制器,目前还未见有文献报道。它不仅简化了机械臂控制系统的构造,而且节约成本,同时还能提高控制精度。
近年来,神经网络已经在模式识别、数字信号处理、系统建模等诸多领域取得了可喜的成就。对神经网络拓扑结构的选择以及神经网络权值的调整都已经发展了严格的理论分析方法。由于神经网络所具有的学习能力,以及神经网络与非线性系统理论中已经发展成熟的一系列控制方法的融合能力,使得基于神经网络的控制方法在机器人领域被广泛研究和应用。
人工神经网络已经在机械臂控制中得到了广泛的应用。已有的基于人工神经网络的机械臂控制方法大都以利用神经网络的通用逼近性为出发点,采用神经网络来逼近机械臂系统未知动力学模型。基于人工神经网络的通用逼近性,所提控制方法可以不依赖于系统的动力学模型,因而在系统存在未知动力学模型的情况下仍然可以达到控制目的。但是,神经网络估计参数(即神经网络权值)的收敛性与持续激励条件的满足相关。而持续激励条件的满足是一件很困难而且很难预先证明的问题。已有的基于神经网络的机械臂控制方法没有考虑持续激励条件的满足,实际上,神经网络通用逼近性的实现并没有得到保证,神经网络的学习能力是相当有限的。因此,在已有的基于神经网络的控制策略中,即使是对于完全相同的控制任务,神经网络也需要重复进行繁琐的训练学习过程。而神经网络的规模会随着机械臂臂数的增大而相应的增大。神经网络的重复训练过程将涉及到庞大的计算量,从而造成时间及能量的浪费。
径向基(Radial Basis Function)神经网络,简称RBF神经网络,具有任意精度的泛函逼近能力和最佳逼近特性,在自适应控制中得到了较多的应用。目前这种方法的主要缺点在于难以理解神经网络的物理意义,难以保证神经网络权值收敛到真值(最优值),继而难以保证神经网络真正逼近系统动态。
确定学习理论近期被用来实现非线性系统动态的准确逼近。通过采用局部RBF神经网络,证明部分持续激励条件能够被满足,如RBF中沿着系统周期或回归轨迹的某些子失量的持续激励条件能够被满足,这个部分持续激励条件的满足可以使得沿着系统周期或回归轨迹的误差系统满足指数稳定。因此,可在沿系统周期或回归轨迹的局部区域内获得对系统动态的准确逼近。
许多实际工程系统,由于系统固有的动态性能以及系统本身的确定性,更适合采用一种具有确定性的学习策略来对其进行控制。这样,当需要再处理相同或相似的控制任务时,就不需要再进行重复的训练学习过程了。
发明内容
本发明的目的在于克服传统的自适应神经网络控制方法在学习能力上的不足,提供基于确定学习理论的机械臂通用控制方法,该方法能够在系统参数完全未知的情况下实现对机械臂闭环控制系统未知动态沿机械臂所经历周期轨迹在局部区域内的准确学习;能够在稳定的动态控制过程中学习到闭环系统动力学的有效知识,并以常数RBF网络权值的方式储存,可将其成功地应用到后续相同或相似的控制任务当中去,以提高控制系统的控制性能,节约能量,具体技术方案如下。
基于确定学习理论的机械臂通用控制方法,包括以下步骤:
(1)建立机械臂的动态模型:建立以机械臂关节角位移以及关节角速度作为状态变量的机械臂动态模型;
(2)建立期望的周期轨迹:建立期望的周期轨迹,使机械臂完成给定的周期工作,并以期望周期轨迹做为机械臂各个状态变量的跟踪信号;
(3)神经网络的学习:根据步骤(1)建立的机械臂动态模型和步骤(2)建立的期望周期轨迹采用RBF神经网络建立自适应神经网络控制器,根据李亚普诺夫稳定性理论调节RBF神经网络的权值,实现机械臂对期望周期轨迹的跟踪,以及RBF神经网络对机械臂闭环系统中未知动力学模型的局部逼近;
(4)建立常数神经网络:根据确定学习理论,沿机械臂系统轨迹的RBF神经网络的神经元满足持续激励条件,其权值收敛到最优值,取权值收敛后的一段时间内各权值的均值作为学习训练结果,并利用这些结果建立常数RBF神经网络;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110148179.1/2.html,转载请声明来源钻瓜专利网。