[发明专利]黑盒模型的解释方法、装置及设备有效
| 申请号: | 202210941212.4 | 申请日: | 2022-08-08 |
| 公开(公告)号: | CN114997549B | 公开(公告)日: | 2022-10-28 |
| 发明(设计)人: | 夏睿;刘乐;杨帆;孙亮 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/06;G06F30/27 |
| 代理公司: | 北京同钧律师事务所 16037 | 代理人: | 柴海平;许怀远 |
| 地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 黑盒 模型 解释 方法 装置 设备 | ||
1.一种黑盒模型的解释方法,其特征在于,包括:
获取待解释的测试点的特征和预测结果,以及参考点的特征和实际观测结果,其中所述测试点的预测结果是将所述测试点的特征输入黑盒模型后得到的输出结果;
根据所述测试点和所述参考点,采样确定多个特征子集;
将已构建的完全随机森林模型作为估值函数,将包含在特征子集内的特征取测试点的特征值、以及未包含在特征子集内的特征取参考点的特征值组成的新样本的特征值输入完全随机森林 模型,得到所述特征子集的估值函数值,根据所述特征子集的估值函数值和包含的特征数量、以及特征总数,确定每项特征的夏普利值,所述完全随机森林模型是基于包含所述测试点的特征和预测结果、所述参考点的特征和实际观测结果的训练数据集构建的,所述完全随机森林模型中每个叶子节点对应一个样本点;
将每项特征的夏普利值作为每项特征对所述预测结果与所述实际观测结果间的差值的贡献度,输出每项特征对所述差值的贡献度。
2.根据权利要求1所述的方法,其特征在于,还包括:
获取训练数据集,所述训练数据集包括历史样本点的特征和实际观测结果,以及测试样本点的特征和预测结果,所述历史样本点包含所述参考点,所述测试样本点包含所述测试点;
根据所述训练数据集构建多棵完全随机树,所述完全随机树中每个叶子节点对应一个样本点,所述多棵完全随机树形成完全随机森林模型。
3.根据权利要求1所述的方法,其特征在于,所述根据所述特征子集的估值函数值和包含的特征数量、以及特征总数,确定每项特征的夏普利值,包括:
针对任一特征,对于不包含当前特征的目标特征子集,确定所述目标特征子集与当前特征的并集,并计算所述并集的估值函数值;
根据每一目标特征子集的估值函数值、每一目标特征子集与当前特征的并集的估值函数值、目标特征子集包含的特征数量、特征总数,计算确定当前特征的夏普利值。
4.根据权利要求3所述的方法,其特征在于,所述计算所述并集的估值函数值,包括:
将包含在所述并集内的特征取测试点的特征值、未包含在所述并集内的特征取参考点的特征值得到的新样本的特征值输入所述完全随机森林模型,将所述完全随机森林模型的输出结果作为所述并集的估值函数值。
5.根据权利要求1所述的方法,其特征在于,所述采样确定多个特征子集,包括:
基于所述完全随机森林模型,将所述测试点落入的叶子节点和所述参考点落入的叶子节点作为目标叶子节点;
对于任一所述目标叶子节点,采样落入由根节点到所述目标叶子节点的路径上任一节点的特征;
根据采样到的特征,生成多个特征子集,其中每一特征子集包含至少一个采样到的特征。
6.根据权利要求1所述的方法,其特征在于,所述采样确定多个特征子集,包括:
根据所述测试点的特征和所述参考点的特征,确定所有的特征子集以及每一特征子集的概率;
根据特征子集的概率采样得到多个特征子集。
7.根据权利要求2所述的方法,其特征在于,所述获取训练数据集,包括:
响应于对黑盒模型的解释指令,获取历史样本点的特征和实际观测结果;
获取测试样本点的特征,并使用所述黑盒模型根据所述测试样本点的特征确定所述测试样本点的预测结果。
8.根据权利要求1所述的方法,其特征在于,所述获取待解释的测试点的特征和预测结果,以及参考点的特征和实际观测结果,包括:
响应于用户指定的测试点和参考点,获取所述参考点的特征和实际观测结果,以及所述测试点的特征,并利用所述黑盒模型根据所述测试点的特征确定所述测试点的预测结果;
所述输出每项特征对所述差值的贡献度,包括:
通过可视化界面向所述用户展示每项特征对所述预测结果与所述实际观测结果间的差值的贡献度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210941212.4/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





