[发明专利]基于元模型和资源数据的模型自主动态优化方法在审
申请号: | 202111245796.3 | 申请日: | 2021-10-26 |
公开(公告)号: | CN114282700A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 冯泽坤;邬春学 | 申请(专利权)人: | 上海理工大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q50/04;G06N3/08 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹;徐颖 |
地址: | 200093 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模型 资源 数据 自主 动态 优化 方法 | ||
本发明涉及一种基于元模型和资源数据的模型自主动态优化方法,在现有的产品生命周期元模型的基础上,利用强化学习的思想,训练出一个可以产生优化策略的智能体,以解决资源数据规模化后元模型的修正问题,达到自主优化,动态调整模型相应参数的结果。在今后面对类型繁多的新资源数据及庞大的数据量时,智能体可以基于元模型和新数据对模型进行自主优化,使产品生命周期模型不断完善,对产品数据的描述更加贴切。
技术领域
本发明涉及一种数据管理技术,特别涉及一种基于元模型和资源数据的模型自主动态优化方法。
背景技术
产品生命周期资源统一建模技术采用抽象的方法建立元模型,元模型的抽象性与产品生命周期相关资源数据的多样性、复杂性和规模化使元模型需要不断优化和更新。
现有元模型既定后便无优化方法,无论使用何种数据、多大批量数据、何时使用元模型,都采用一开始建立的元模型。但此元模型即对当前已知的资源数据高度抽象而建立起来的,且需要应用在新的资源数据之上,故为了今后使用此元模型描述新的资源数据时,能够高效、准确的描述新的资源数据,且与新资源数据有高度耦合性,我们需要对元模型进行实时优化。
目前存在的对元模型进行优化的方法包括:实时测量求解最优加权向量后指定最优策略、深度神经网络结构剪枝、量化、知识蒸馏等。以上优化方法需要人力加以控制;优化过程仅针对某一次数据得到优化策略,不会对元模型本身进行优化,无法实现迭代过程;优化方法在减少模型体积、提升运行速率上有很好的表现,但不专门针对提高元模型和新数据的耦合度。
发明内容
针对产品元模型优化问题,提出了一种基于元模型和资源数据的模型自主动态优化方法,通过强化学习的思想,使元模型在面对大量新资源数据时可以做到自主优化,以实现产品生命周期资源统一模型对资源数据的描述更加贴合。
本发明的技术方案为:一种基于元模型和资源数据的模型自主动态优化方法,具体包括如下步骤:
1)根据产品生命周期中各种资源数据的特征构造好产品生命周期所需的资源统一元模型;
2)创建强化学习智能体,将现存资源数据作为智能体的训练环境;
智能体对现有存资源数据进行学习,根据每条数据建立、改进或完善出一个虚拟模型,智能体每个动作都会返回相应的奖赏,奖赏值的高低反映了此次优化行为的优劣,累计奖赏最高的动作或动作集,趋向与最佳优化策略;
3)智能体通过步骤2)历史经验的训练,可判断某状态下执行何种既定动作的奖赏最高,即在数据不匹配的情况下的最佳优化方式,优化后的智能体作为虚拟模型;
4)当有新的资源数据进入,新的资源数据同时进入智能体和元模型,智能体和元模型本身共同处理新的资源数据,若新的资源数据与元模型匹配,则直接用元模型描述新的资源数据;若不匹配,则智能体根据历史经验优化虚拟模型,优化后的虚拟模型与新的资源数据匹配成功后,则此动作对应为元模型的最佳优化方法,将此优化动作用于现实世界的元模型中。
进一步,所述智能体的训练方法:
首先、用户自定义优化动作,包括添加属性、扩大范围、完善参数、改动描述方式,包括参数和结构在内的每一处可优化的点,作为智能体可以选择的优化动作;同时,用户指定奖惩机制,对于完全匹配、部分匹配的状态,按匹配的比例对当前执行的动作制定奖赏值,对于不匹配的状态,同样制定惩罚值;因奖赏为正值、惩罚为负值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海理工大学,未经上海理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111245796.3/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置