[发明专利]实现对机器学习模型的预测结果进行解释的方法及装置在审
| 申请号: | 202010307164.4 | 申请日: | 2020-04-17 |
| 公开(公告)号: | CN111523677A | 公开(公告)日: | 2020-08-11 |
| 发明(设计)人: | 吕自荟;王雨萱;徐昀;石光川;罗远飞;万超 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00 |
| 代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 王明远 |
| 地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 实现 机器 学习 模型 预测 结果 进行 解释 方法 装置 | ||
1.一种实现对机器学习模型的预测结果进行解释的方法,包括:
获取机器学习模型和待解释的样本数据;
确定用于对所述机器学习模型对所述样本数据进行预测得到的预测结果进行解释的解释方法;
使用所确定的解释方法处理所述预测结果得到解释数据;以及
输出所述解释数据。
2.根据权利要求1所述的方法,其中,每条样本数据包括一个或多个特征字段,使用所确定的解释方法处理所述预测结果得到解释数据的步骤包括:
使用所确定的解释方法计算至少部分特征字段的字段名和/或字段值对所述预测结果的贡献值。
3.根据权利要求2所述的方法,其中,计算至少部分特征字段的字段名和/或字段值对所述预测结果的贡献值的步骤包括:
获取所述机器学习模型对所述样本数据的特征抽取结果;
根据所述特征抽取结果,以特征字段的编号为键、以字段名为值,构造第一键值对集合;
计算各个编号对所述预测结果的第一贡献值,以得到第一解释数据集合,所述第一解释数据集合包括多条第一解释数据,所述第一解释数据以所述编号为键,以第一贡献值为值;
遍历所述第一解释数据集合中的每条第一解释数据,在所述第一键值对集合中寻找与所述第一解释数据的键相同的键所对应的字段名,并将所述字段名替换所述第一解释数据的键,以得到以所述字段名为键、以所述第一贡献值为值的第一解释数据。
4.根据权利要求3所述的方法,其中,计算至少部分特征字段的字段名和/或字段值对所述预测结果的贡献值的步骤还包括:
根据所述特征抽取结果,以特征字段的编号及签名为键、以特征字段的字段值为值,构造第二键值对集合;
计算各个编号及签名对所述预测结果的第二贡献值,以得到第二解释数据集合,所述第二解释数据集合包括多条第二解释数据,所述第二解释数据以特征字段的编号及签名为键、以第二贡献值为值;
遍历所述第二解释数据集合中的每条第二解释数据,在所述第二键值对中寻找与第二解释数据的键相同的键所对应的字段值,在所述第一键值对中寻找与所述第二解释数据的键中的编号所对应的字段名,以得到该字段名下的字段值的第二贡献值。
5.根据权利要求1所述的方法,其中,确定用于对所述机器学习模型对所述样本数据进行预测得到的预测结果进行解释的解释方法的步骤包括:
从多种解释方法中选择与所述机器学习模型的类型相适配的解释方法。
6.根据权利要求5所述的方法,其中,所述多种解释方法包括:
夏普利值分析方法,用于根据夏普利值的分配方式将所述机器学习模型针对所述样本数据进行预测得到的预测结果所对应的分值分配给所述样本数据中的至少部分特征中的每个特征,以得到所述特征对所述预测结果的重要程度;
信息增益方法,用于通过计算所述样本数据中至少部分特征中每个特征的信息增益,确定所述特征对所述预测结果的重要程度;
特征权重分析方法,用于提供计算计算所述样本数据中至少部分特征中每个特征的权重,确定所述特征对所述预测结果的重要程度。
7.根据权利要求1所述的方法,还包括:
获取针对所述解释数据的配置信息,其中,
使用所确定的解释方法处理所述预测结果得到解释数据的步骤包括:根据所述配置信息使用所确定的解释方法计算所述预测结果的解释数据;并且/或者输出解释数据的步骤包括:根据所述配置信息输出解释数据。
8.一种实现对机器学习模型的预测结果进行解释的装置,包括:
获取模块,用于获取机器学习模型和待解释的样本数据;
确定模块,用于确定用于对所述机器学习模型对所述样本数据进行预测得到的预测结果进行解释的解释方法;
处理模块,用于使用所确定的解释方法处理所述预测结果得到解释数据;
输出模块,用于输出所述解释数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010307164.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:滤芯、空气净化器及空气净化方法
- 下一篇:基于链代码的权限查询配置方法及装置





