[发明专利]基于元模型和资源数据的模型自主动态优化方法在审
申请号: | 202111245796.3 | 申请日: | 2021-10-26 |
公开(公告)号: | CN114282700A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 冯泽坤;邬春学 | 申请(专利权)人: | 上海理工大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q50/04;G06N3/08 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹;徐颖 |
地址: | 200093 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模型 资源 数据 自主 动态 优化 方法 | ||
1.一种基于元模型和资源数据的模型自主动态优化方法,其特征在于,具体包括如下步骤:
1)根据产品生命周期中各种资源数据的特征构造好产品生命周期所需的资源统一元模型;
2)创建强化学习智能体,将现存资源数据作为智能体的训练环境;
智能体对现有存资源数据进行学习,根据每条数据建立、改进或完善出一个虚拟模型,智能体每个动作都会返回相应的奖赏,奖赏值的高低反映了此次优化行为的优劣,累计奖赏最高的动作或动作集,趋向与最佳优化策略;
3)智能体通过步骤2)历史经验的训练,可判断某状态下执行何种既定动作的奖赏最高,即在数据不匹配的情况下的最佳优化方式,优化后的智能体作为虚拟模型;
4)当有新的资源数据进入,新的资源数据同时进入智能体和元模型,智能体和元模型本身共同处理新的资源数据,若新的资源数据与元模型匹配,则直接用元模型描述新的资源数据;若不匹配,则智能体根据历史经验优化虚拟模型,优化后的虚拟模型与新的资源数据匹配成功后,则此动作对应为元模型的最佳优化方法,将此优化动作用于现实世界的元模型中。
2.根据权利要求1所述基于元模型和资源数据的模型自主动态优化方法,其特征在于,所述智能体的训练方法:
首先、用户自定义优化动作,包括添加属性、扩大范围、完善参数、改动描述方式,包括参数和结构在内的每一处可优化的点,作为智能体可以选择的优化动作;同时,用户指定奖惩机制,对于完全匹配、部分匹配的状态,按匹配的比例对当前执行的动作制定奖赏值,对于不匹配的状态,同样制定惩罚值;因奖赏为正值、惩罚为负值;
然后、将现有的资源数据作为与智能体的交互环境,根据强化学习中基于模型的思想,智能体对现有数据进行学习,根据每条数据建立、改进或完善出一个虚拟模型,其具体过程为智能体基于现有数据,从无到有建立虚拟模型,并与虚拟模型进行交互,在虚拟模型上匹配每一条数据,面对数据不匹配的情况,智能体选择预定义中的动作对模型进行操作后,返回奖赏,保存此次操作的模型状态、所选动作和奖赏为状态Sn、动作An、奖赏Bn组合数据,再匹配下一条数据,根据最终整体的数据匹配情况反馈相应的累积奖赏,多次重复上述过程后,累计奖赏达到预期设定的峰值时,即现有数据中的每一条都完全与智能体建立出的虚拟模型匹配时,智能体训练完毕。
3.根据权利要求2所述基于元模型和资源数据的模型自主动态优化方法,其特征在于,所述与元模型不匹配的新的资源数据,智能体将根据历史经验和新数据,选择预定义动作中,在该状态下奖赏最高的动作或动作集,对虚拟模型进行改进;在虚拟模型改进后,若可与新数据匹配,则此动作即为元模型的最佳优化方法;若改进后的虚拟模型依旧无法与新数据匹配,则智能体继续进行上述优化虚拟模型的过程,直至与新数据匹配为止。
4.根据权利要求3所述基于元模型和资源数据的模型自主动态优化方法,其特征在于,所述优化虚拟模型的过程重复超过用户定义的一个阈值,即所有动作都无法将虚拟模型优化成可与新数据匹配的状态,人工介入检查是否为智能体训练不充分、预定义动作需要补充,或其它人为、数据、冲突类型的错误;针对问题人为优化元模型或重新训练智能体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海理工大学,未经上海理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111245796.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置