[发明专利]基于结果画像的模型解释方法、系统、计算及存储设备有效
| 申请号: | 202011416347.6 | 申请日: | 2020-12-07 |
| 公开(公告)号: | CN112215366B | 公开(公告)日: | 2021-03-02 |
| 发明(设计)人: | 杨艾森;熊靖汶;陈文 | 申请(专利权)人: | 成都数联铭品科技有限公司 |
| 主分类号: | G06N20/10 | 分类号: | G06N20/10;G06K9/62 |
| 代理公司: | 成都天嘉专利事务所(普通合伙) 51211 | 代理人: | 康拯通 |
| 地址: | 610000 四川省成都市中国(四川)自由*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 结果 画像 模型 解释 方法 系统 计算 存储 设备 | ||
1.基于结果画像的模型解释方法,其特征在于,包括以下步骤:
步骤1,将包括若干数值和非数值型特征的数据输入到训练好的、给定有监督的机器学习模型中,并得到机器学习对数据分类的输出结果;
步骤2,使用数学期望算法计算数据中数值和非数值型特征的特征值对所述输出结果的影响;
步骤3,根据步骤2中计算得到的数值和非数值型特征的特征值对所述输出结果的影响,按照各个特征值对输出结果的影响从大到小的顺序,采用聚类方法将步骤1中输入的数据中的每一个维度的数据、对应机器学习的输出结果相同的数据进行逐级划分,得到对应步骤1中机器学习对数据的分类结果的特征值的主要分布区间;
步骤4,根据步骤3中得到的对应特征值的主要分布区间,进行簇标签构建;
步骤5,根据上述步骤2-4的结果,对步骤1中机器学习对数据分类的输出结果进行可视化处理并展示,根据步骤2-4的结果绘制旭日图,具体的,根据步骤3中得到划分后对应特征值的主要分布区间以及步骤4中构建的簇标签,对步骤1中输入的数据、输出结果进行旭日图绘制,其中,旭日图圈层总数量等于数据中特征数总量加一,旭日图最内为第一圈层,其各扇环表示模型的输出结果,每个扇环代表一簇结果;依步骤2计算的各个特征值对所述输出结果的影响,并根据各个特征值对所述输出结果的影响大小对特征值进行排序,构建用于表示数据不同特征的第二圈层到最外圈层;根据步骤3中得到划分后对应特征值的主要分布区间,分别对应旭日图自内到外的各个扇环,并在每一个扇环对应标记步骤4得到的簇标签。
2.如权利要求1所述的基于结果画像的模型解释方法,其特征在于,步骤2中,所述数学期望算法,具体的,包括以下步骤:
将数据中包含的p个特征值(x1,x2,...,xp)构成特征组合S;
对每个未包含在特征组合S中的特征值进行积分迭代计算,得到机器学习模型机器学习的输出结果期望
,以及期望平均影响,其中, P为特征值出现的概率,dP是特征值出现的概率P的微分增量,期望平均影响EX中X是指所有特征的集合,满足|X|=p;
以输出结果期望减去期望平均影响得到特征组合S对输出结果的边际影响
,其中边际影响valX中X同样是指所有特征的集合,满足|X|=p;
考虑特征组合S对输出结果的边际影响,则第j个特征xj对输出结果的影响为,S是特征的组合,xj是不属于S的一个特征,(S U {xj})是对两者求并集,对应的加权因子为,其中,∣S∣表示特征组合S中元素的个数。
3.如权利要求2所述的基于结果画像的模型解释方法,其特征在于:所述第j个特征xj对输出结果的影响,是考虑所有特征组合S的输出结果的影响的加权平均值
,
其中{x1,...,xp}\{xj}表示集合{x1,...,xp}去掉xj的子集,即是不属于S的一个特征,(S U {xj})是对两者求并集。
4.如权利要求1所述的基于结果画像的模型解释方法,其特征在于:所述步骤3中,采用聚类方法对步骤1中输出结果相同的数据进行逐级划分时,当输出结果相同的数据数量少于数据总数量的1%时,停止继续划分。
5.如权利要求1所述的基于结果画像的模型解释方法,其特征在于:所述步骤3中,采用聚类方法对步骤1中输出结果相同的数据进行逐级划分,具体的,是根据各个特征值对输出结果的影响从大到小的顺序,依次分别对上一层级特征划分结果中的每个特征值区间内的数据,在当前特征维度采用相同的聚类方法进行划分并得到特征值区间,直至所有特征的所有数据均被划分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数联铭品科技有限公司,未经成都数联铭品科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011416347.6/1.html,转载请声明来源钻瓜专利网。





