[发明专利]实现对机器学习模型的预测结果进行解释的方法及装置在审
申请号: | 202010307164.4 | 申请日: | 2020-04-17 |
公开(公告)号: | CN111523677A | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 吕自荟;王雨萱;徐昀;石光川;罗远飞;万超 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 王明远 |
地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实现 机器 学习 模型 预测 结果 进行 解释 方法 装置 | ||
公开了一种实现对机器学习模型的预测结果进行解释的方法及装置。获取机器学习模型和待解释的样本数据;确定用于对机器学习模型对样本数据进行预测得到的预测结果进行解释的解释方法;使用所确定的解释方法处理预测结果得到解释数据;以及输出解释数据。由此,可以针对不同机器学习模型适配相应的解释方法,从而可以提高方案的通用性。
技术领域
本发明总体说来涉及人工智能领域,更具体地说,涉及一种实现对机器学习模型的预测结果进行解释的方法及装置。
背景技术
机器学习是人工智能研究发展到一定阶段的必然产物,其致力于通过计算的手段,利用经验来改善系统自身的性能。在计算机系统中,“经验”通常以“数据”形式存在,通过机器学习算法,可从数据中产生“模型”,也就是说,将经验数据提供给机器学习算法,就能基于这些经验数据产生模型,在面对新的情况时,模型会提供相应的判断,即,预测结果。
对用户而言机器学习模型相当于一个黑盒,如何解释机器学习模型是目前亟待解决的问题,而对模型预测结果的解释又是其中一个重要部分。
因此,需要一种能够对模型预测结果进行解释的方案。
发明内容
本发明的示例性实施例旨在提供一种实现对机器学习模型的预测结果进行解释的方案。
根据本发明的第一个方面,提出了一种实现对机器学习模型的预测结果进行解释的方法,包括:获取机器学习模型和待解释的样本数据;确定用于对机器学习模型对样本数据进行预测得到的预测结果进行解释的解释方法;使用所确定的解释方法处理预测结果得到解释数据;以及输出解释数据。
可选地,每条样本数据包括一个或多个特征字段,使用所确定的解释方法处理预测结果得到解释数据的步骤包括:使用所确定的解释方法计算至少部分特征字段的字段名和/或字段值对预测结果的贡献值。
可选地,计算至少部分特征字段的字段名和/或字段值对预测结果的贡献值的步骤包括:获取机器学习模型对样本数据的特征抽取结果;根据特征抽取结果,以特征字段的编号为键、以字段名为值,构造第一键值对集合;计算各个编号对预测结果的第一贡献值,以得到第一解释数据集合,第一解释数据集合包括多条第一解释数据,第一解释数据以编号为键,以第一贡献值为值;遍历第一解释数据集合中的每条第一解释数据,在第一键值对集合中寻找与第一解释数据的键相同的键所对应的字段名,并将字段名替换第一解释数据的键,以得到以字段名为键、以第一贡献值为值的第一解释数据。
可选地,计算至少部分特征字段的字段名和/或字段值对预测结果的贡献值的步骤还包括:根据特征抽取结果,以特征字段的编号及签名为键、以特征字段的字段值为值,构造第二键值对集合;计算各个编号及签名对预测结果的第二贡献值,以得到第二解释数据集合,第二解释数据集合包括多条第二解释数据,第二解释数据以特征字段的编号及签名为键、以第二贡献值为值;遍历第二解释数据集合中的每条第二解释数据,在第二键值对中寻找与第二解释数据的键相同的键所对应的字段值,在第一键值对中寻找与第二解释数据的键中的编号所对应的字段名,以得到该字段名下的字段值的第二贡献值。
可选地,确定用于对机器学习模型对样本数据进行预测得到的预测结果进行解释的解释方法的步骤包括:从多种解释方法中选择与机器学习模型的类型相适配的解释方法。
可选地,多种解释方法包括:夏普利值分析方法,用于根据夏普利值的分配方式将机器学习模型针对样本数据进行预测得到的预测结果所对应的分值分配给样本数据中的至少部分特征中的每个特征,以得到特征对预测结果的重要程度;信息增益方法,用于通过计算样本数据中至少部分特征中每个特征的信息增益,确定特征对预测结果的重要程度;特征权重分析方法,用于提供计算计算样本数据中至少部分特征中每个特征的权重,确定特征对预测结果的重要程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010307164.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:滤芯、空气净化器及空气净化方法
- 下一篇:基于链代码的权限查询配置方法及装置