[发明专利]一种模型升级方法和系统、数据处理方法和系统在审
申请号: | 202310189047.6 | 申请日: | 2023-02-22 |
公开(公告)号: | CN116051962A | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 王丽芸 | 申请(专利权)人: | 北京爱笔科技有限公司 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/774;G06N3/04;G06N3/08;G06V40/16 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 柳虹 |
地址: | 100094 北京市海淀区北清路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 升级 方法 系统 数据处理 | ||
1.一种模型升级方法,应用于多业务场景,其特征在于,所述多业务场景应用的初始模型相同;
所述方法包括:
从待升级的模型处理过的业务数据中采集第一训练数据;所述处理过的业务数据包括被处理的业务信息和待升级的模型对业务信息进行处理得到的处理后结果信息;
对第一训练数据进行预处理得到第二训练数据;
利用第二训练数据对至少一个待训练的模型进行自训练;
对至少一个训练好的模型进行测试,得到测试结果,根据所述测试结果得到目标模型;
基于所述目标模型对待升级的模型进行升级。
2.根据权利要求1所述的方法,其特征在于,所述对第一数据进行预处理得到第二训练数据,包括:
对第一数据进行数据清洗,对清洗后的第一数据进行预处理,得到第二训练数据。
3.根据权利要求1所述的方法,其特征在于,所述基于所述目标模型对待升级的模型进行升级,包括:
按照预设规则比较所述目标业务模型和待升级的模型的性能;
若所述目标业务模型性能优于待升级的模型,则将所述目标业务模型替换待升级的模型。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据存储空间容量大小,确定自训练的模型数量。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:每隔预设时间触发一次自训练,或者当数据库中的第一训练数据的新增量达到预设量时触发自训练。
6.一种数据处理方法,应用于多业务场景,其特征在于,所述方法包括:
接收待处理数据;
利用待处理数据对应的业务处理模型对所述待处理数据进行处理,得到处理结果;所述业务处理模型利用如权利要求1-4中任一项所述的模型升级方法进行升级。
7.一种模型升级系统,应用于多业务系统,其特征在于,所述多业务系统应用的初始模型相同;
所述模型升级系统包括:
训练数据采集模块,用于从待升级的模型处理过的业务数据中采集第一训练数据;所述处理过的业务数据包括被处理的业务信息和待升级的模型对业务信息进行处理得到的处理后结果信息;
训练数据处理模块,用于对第一训练数据进行预处理得到第二训练数据;
模型自训练模块,用于利用第二训练数据对至少一个待训练的模型进行自训练;
模型测试模块,用于对至少一个训练好的模型进行测试,得到测试结果,根据所述测试结果得到目标模型;
升级上线模块,用于基于所述目标模型对待升级的模型进行升级。
8.一种数据处理系统,其特征在于,包括:多个数据处理子系统和如权利要求7所述的模型升级系统;
所述数据处理子系统用于接收待处理数据;利用待处理数据对应的业务处理模型对所述待处理数据进行处理,得到处理结果;模型升级系统用于对每个数据处理子系统的业务处理模型进行升级。
9.一种计算机设备,其特征在于,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-5任一项所述的模型升级方法或如权利要求6所述的数据处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行如权利要求1-5任一项所述的模型升级方法或如权利要求6所述的数据处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京爱笔科技有限公司,未经北京爱笔科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310189047.6/1.html,转载请声明来源钻瓜专利网。