[发明专利]一种模型升级方法和系统、数据处理方法和系统在审
申请号: | 202310189047.6 | 申请日: | 2023-02-22 |
公开(公告)号: | CN116051962A | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 王丽芸 | 申请(专利权)人: | 北京爱笔科技有限公司 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/774;G06N3/04;G06N3/08;G06V40/16 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 柳虹 |
地址: | 100094 北京市海淀区北清路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 升级 方法 系统 数据处理 | ||
本申请公开一种模型升级方法和系统、数据处理方法和系统。所述模型升级方法,应用于多业务场景,所述多业务场景应用的初始模型相同;所述方法包括:从待升级的模型处理过的业务数据中采集第一训练数据;对第一训练数据进行预处理得到第二训练数据;利用第二训练数据对至少一个待训练的模型进行自训练;对至少一个训练好的模型进行测试,得到测试结果,根据所述测试结果得到目标模型;基于所述目标模型对待升级的模型进行升级。从训练数据的收集到模型的产出,整个流程没有人工干预的,能够避免了数据的泄露。同时由于训练数据来源于相应的业务场景中的数据,因此迭代升级的模型能够更好的适配业务场景。
技术领域
本申请涉及数据处理领域,尤其涉及一种模型升级方法和系统、数据处理方法和系统、计算机设备和存储介质。
背景技术
在很多业务场景中,由于隐私保护的要求,数据是不允许流出的。比如在机场场景中,过安检的人脸图片和机场中抓拍到的人脸图片,这些涉及个人隐私的数据是不允许拷贝出来的。因此,算法人员是无法拿到业务场景中的数据来进行业务模型的训练,增加了训练的难度。
发明内容
基于上述问题,本申请提供了一种模型升级方法和系统、数据处理方法和系统、计算机设备和存储介质,能够在无人工干预的情况下实现业务模型优化。
本申请公开了如下技术方案:
本申请第一方面提供一种模型升级方法,应用于多业务场景,所述多业务场景应用的初始模型相同;
所述方法包括:
从待升级的模型处理过的业务数据中采集第一训练数据;所述处理过的业务数据包括被处理的业务信息和待升级的模型对业务信息进行处理得到的处理后结果信息;
对第一训练数据进行预处理得到第二训练数据;
利用第二训练数据对至少一个待训练的模型进行自训练;
对至少一个训练好的模型进行测试,得到测试结果,根据所述测试结果得到目标模型;
基于所述目标模型对待升级的模型进行升级。
在一个可能的实现方式中,所述对第一数据进行预处理得到第二训练数据,包括:
对第一数据进行数据清洗,对清洗后的第一数据进行预处理,得到第二训练数据。
在一个可能的实现方式中,所述基于所述目标模型对待升级的模型进行升级,包括:
按照预设规则比较所述目标业务模型和待升级的模型的性能;
若所述目标业务模型性能优于待升级的模型,则将所述目标业务模型替换待升级的模型。
在一个可能的实现方式中,所述方法还包括:根据存储空间容量大小,确定自训练的模型数量。
在一个可能的实现方式中,所述方法还包括:每个预设时间触发一次自训练,或者当所述第一训练数据达到预设量时触发自训练。
本申请第二方面提供一种数据处理方法,应用于多业务场景,所述方法包括:
接收待处理数据;
利用待处理数据对应的业务处理模型对所述待处理数据进行处理,得到处理结果;所述处理模型利用如本申请实施例第一方面中任一项所述的模型升级方法进行升级。
本申请第三方面提供一种模型升级系统,应用于多业务系统,所述多业务系统应用的初始模型相同;
所述模型升级系统包括:
训练数据采集模块,用于从待升级的模型处理过的业务数据中采集第一训练数据;所述处理过的业务数据包括被处理的业务信息和待升级的模型对业务信息进行处理得到的处理后结果信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京爱笔科技有限公司,未经北京爱笔科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310189047.6/2.html,转载请声明来源钻瓜专利网。