[发明专利]基于连续动作学习自动机的全局优化系统及方法在审

申请号：	201710520108.7	申请日：	2017-06-30
公开（公告）号：	CN109214518A	公开（公告）日：	2019-01-15
发明（设计）人：	李生红;葛昊;马颖华;黄德双;江文;狄冲;周之晟;李怡晨	申请（专利权）人：	上海交通大学;携程计算机技术（上海）有限公司
主分类号：	G06N20/00	分类号：	G06N20/00
代理公司：	上海交达专利事务所 31201	代理人：	王毓理;王锡麟
地址：	200240 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	环境反馈平滑函数行为选择初始化模块学习自动机更新模块连续动作全局优化一次迭代算法输入输出模块改进参数输入多次迭代更新算法输出模块输入行为选择模块输出引入初始化极值点正确率最小解最优解收敛搜索跳出更新全局
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于连续动作学习自动机的全局优化系统，其特征在于，包括：初始化模块、行为选择模块、环境反馈模块、更新模块和输出模块，其中：初始化模块初始化CALA算法的参数，输入行为选择模块进行行为选择，行为通过路径环境的应用得到反馈然后进入环境反馈模块，得到行为对应的环境反馈；更新模块根据环境反馈更新CALA算法的参数，将更新的参数输入行为选择模块完成一次迭代；当迭代次数达到设定值时，将当前的环境反馈输入输出模块，输出最优的路径信息。

2.一种基于权利要求1所述系统的连续动作学习自动机的全局优化方法，其特征在于，首先通过现有的CALA算法得到局部最优解，根据该局部最优解得到改进的平滑函数；将改进的平滑函数引入现有的CALA算法得到优化的CALA算法，通过优化的CALA算法进行多次迭代，最终得到极值点，作为全局极小值输出；

所述的迭代是指：在CALA算法中引入改进的平滑函数进行一轮迭代得到局部最优解，当本轮局部最优解小于上一轮迭代得到的局部最优解时，将本轮迭代得到的局部最优解设置为局部最优解的点，再进行下一轮迭代，直至当前一轮迭代的局部最优解大于或等于上一轮迭代得到的局部最优解，即上一轮迭代得到的局部最优解为极值点。

3.根据权利要求2所述的全局优化方法，其特征是，所述的迭代在每一轮中的次数相同。

4.根据权利要求2所述的全局优化方法，其特征是，所述的改进的平滑函数的定义为：其中：F(x，x^*)＝min(f(x)，f(x^*))为平滑函数，a和b为设定的常数，x为当前选择的值，x^*为已获得的局部最优解的值，f(.)为求取函数。

5.根据权利要求2所述的全局优化方法，其特征是，所述的优化的CALA算法包括以下步骤：

步骤1、初始化CALA算法的参数，并设定迭代次数和各常量参数的值；

步骤2、根据当前的分布随机产生一个值并将该值作为行为输入环境，得到观测值；

步骤3、从环境中获得相应的反馈，即引入改进的平滑函数；

步骤4、根据步骤3中的反馈更新分布的均值和标准差；

步骤5、对迭代次数进行计数，如果迭代次数小于设定的每轮迭代的次数，则回到步骤2；否则观测值作为本轮得到的局部最优解进行步骤6；

步骤6、当本轮迭代得到的局部最优解小于上一轮迭代得到的局部最优解时，将本轮的局部最优解赋值给上一轮得到的局部最优解的点并记录，返回步骤2进行下一轮迭代；否则将上一轮迭代得到的局部最优解的点，即极值点作为全局极小值输出，结束本算法；

所述的标准差的迭代次数在每轮迭代中不清零。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海交通大学;携程计算机技术（上海）有限公司，未经上海交通大学;携程计算机技术（上海）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710520108.7/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于连续动作学习自动机的全局优化系统及方法在审

专利文献下载