[发明专利]一种用于更新神经网络预测模型的方法和装置在审
| 申请号: | 202011557492.6 | 申请日: | 2020-12-24 |
| 公开(公告)号: | CN112734086A | 公开(公告)日: | 2021-04-30 |
| 发明(设计)人: | 陈杰;陈高均;潘昊 | 申请(专利权)人: | 贝壳技术有限公司 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/16;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京市尚公律师事务所 11746 | 代理人: | 回旋;贺小明 |
| 地址: | 300457 天津市滨海新区经济技术开发*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 更新 神经网络 预测 模型 方法 装置 | ||
本发明提供一种用于更新神经网络预测模型的方法和装置,所述方法包括:获取当前训练样本;对预设的第一预测模型进行训练,得到第二预测模型;通过模型解释工具,得到利用第一预测模型所预测的第一对象的各种特征的重要度所组成的第一特征重要度集合、以及利用第二预测模型所预测的第二对象的各种特征的重要度所组成的第二特征重要度集合;计算第一特征重要度集合与第二特征重要度集合之间的相似度;将相似度与预设阈值进行比较:如果相似度大于或等于预设阈值,则将第一预测模型更新为第二预测模型;如果相似度小于预设阈值,则不更新第一预测模型。本发明的方法和装置在为神经网络预测模型提供及时且可靠的更新的同时,具备可解释性。
技术领域
本发明涉及计算机技术领域,特别涉及一种用于更新神经网络预测模型的方法和装置。
背景技术
当前,神经网络模型非常强大,例如图像领域常用的CNN网络和自然语言处理的RNN网络都可以高效地解决实际问题,如人脸识别和文本翻译等问题。同样,在典型的结构化数据场景中,复杂的神经网络可以充分利用静态数据和时序数据实现准确的预测,例如在AI选房技术中,神经网络通过对房源基础数据、用户行为数据和经纪人作业数据等的充分挖掘,可以为全国100多个城市将近300万房源计算出准确的评分,以此为经纪人提供近14天成交概率信息,提升库存房源的去化率。
但是,随着线上引入越来越多的神经网络模型,为了适应各种变化因素并确保模型总能给出正确的结果,通常在上线一个模型后,需要对模型进行不断的更新。然而,在计算机机器学习领域,用于更新模型的方法非常有限。
目前,通常是基于损失函数来对神经网络模型进行更新,即通过监测能够反映预测值与实际值之间差距的数学公式的变化来更新模型。回归任务中最常用的是均方误差损失函数;在分类任务中最常用的是交叉熵损失函数。但是,由于损失函数的变化往往在一定时间范围内小于千分之一,因此,仅仅依据损失函数来对模型进行更新是不及时且不具备可解释性的。
因此,需要一种基于可解释性的模型更新方法,以保证复杂的神经网络模型的可靠性。
需要说明的是,以上背景技术部分所公开的信息仅用于增强对本发明背景的理解,因此其可能包含不构成对本领域技术人员已知的现有技术的信息。
发明内容
为了解决现有技术中存在的问题,本发明提供一种用于更新神经网络预测模型的方法,其在为神经网络预测模型提供及时且可靠的更新的同时,具备可解释性,从而克服现有技术中存在的问题。
本发明提供一种用于更新神经网络预测模型的方法,包括以下步骤:获取当前训练样本;基于所述当前训练样本对预设的第一预测模型进行训练,得到第二预测模型;通过模型解释工具,得到利用所述第一预测模型所预测的第一对象的各种特征的重要度所组成的第一特征重要度集合、以及利用所述第二预测模型所预测的第二对象的各种特征的重要度所组成的第二特征重要度集合;计算所述第一特征重要度集合与所述第二特征重要度集合之间的相似度;将所述相似度与预设阈值进行比较:如果所述相似度大于或等于所述预设阈值,则将所述第一预测模型更新为所述第二预测模型;如果所述相似度小于所述预设阈值,则不更新所述第一预测模型。
根据本发明一实施例,通过模型解释工具,得到利用所述第一预测模型所预测的第一对象的各种特征的重要度所组成的第一特征重要度集合、以及利用所述第二预测模型所预测的第二对象的各种特征的重要度所组成的第二特征重要度集合包括:通过模型解释工具,得到所述第一对象和所述第二对象各自所包含的每个子对象的每个特征的重要性数值;将所述第一对象和所述第二对象各自所包含的每个子对象的每个特征的重要性数值分别进行聚类,得到第一对象和第二对象各自每种特征的重要度;将所述第一对象和第二对象各自每种特征的重要度分别进行排序,得到对应于所述第一对象的第一重要度排序集和对应于所述第二对象的第二重要度排序集。
根据本发明一实施例,计算所述第一特征重要度集合与所述第二特征重要度集合之间的相似度包括:计算所述第一重要度排序集与所述第二重要度排序集之间的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝壳技术有限公司,未经贝壳技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011557492.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:竹纤维化纤交织面料及织造方法
- 下一篇:一种VR全景视频信息处理方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





