[发明专利]训练人工智能模型的方法和装置在审
申请号: | 202010043527.8 | 申请日: | 2020-01-15 |
公开(公告)号: | CN113128544A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 高玥;张姝;孙俊 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杜诚;刘敏 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 人工智能 模型 方法 装置 | ||
1.一种用于训练分类模型的方法,其中,所述分类模型用于处理张量数据,并且输出指示多种类别之一的分类结果,所述张量数据包括多个元素,每个元素包括多个特征,所述方法包括:
对所述张量数据进行分解以获得核心张量;
基于所述核心张量执行第一解释算法,以确定所述多个元素中的每个元素对于每种类别的贡献分,其中,所述贡献分表示所述元素对于所述类别被确定为分类结果的贡献程度;
在所述多个元素中选择贡献分大于阈值的元素;
针对所选择的元素中的每一个,利用第二解释算法来确定所述元素中的每个特征对于每种类别的重要性分数;
基于重要性分数来选择特征,并且基于所选择的特征来构建张量数据训练样本;以及
利用构建的张量数据训练样本来训练所述分类模型。
2.根据权利要求1所述的方法,其中,所述第一解释算法是高阶的局部可解析的模型无关的解释方法(LIME),所述第二解释算法是低阶的局部解释方法或低阶的全局解释方法。
3.根据权利要求2所述的方法,其中,在所述第一解释算法中使用马氏距离的指数核作为邻近性度量核。
4.根据权利要求1所述的方法,其中,所述贡献分具有正值和负值,并且所述方法还包括:选择所述贡献分的绝对值大于所述阈值的元素。
5.根据权利要求1所述的方法,还包括:通过以下方式来确定所述阈值:
确定每个元素对于各种类别的贡献分,并且将所述元素标记为贡献分最高的类别;
针对每一种类别,基于贡献分,对被标记为所述类别的各个元素进行排序,并且选择贡献分大于初始阈值的元素;
利用所选择的元素以及相应的类别来训练分类器,其中,在训练中基于所述分类器的性能指标来执行迭代处理,以确定所述阈值。
6.根据权利要求5所述的方法,其中,在所述迭代处理中,
当所述分类器的性能指标尚未达到最优值时,改变当前阈值,并且基于改变后的阈值再次选择元素;
当所述分类器的性能指标达到最优值时,将当前阈值确定为所述阈值。
7.根据权利要求6所述的方法,其中,所述分类器的性能指标是受试者工作特征曲线(ROC)下方面积(AUC)。
8.根据权利要求1所述的方法,其中,基于重要性分数来选择特征的步骤还包括:
选择重要性分数高于预定值的特征;或者,
基于各个特征的重要性分数之间的相互比较来选择特征。
9.根据权利要求1所述的方法,其中,
所述张量数据是通话数据,并且所述张量数据的一个元素对应于一条通话记录;或者
所述张量数据是网络攻击数据,并且所述张量数据的一个元素对应于一次网络攻击的日志数据;或者
所述张量数据是用于药物挖掘的图数据,并且所述张量数据的一个元素对应于一种化合物。
10.一种用于训练分类模型的装置,其中,所述分类模型用于处理张量数据,并且输出指示多种类别之一的分类结果,所述张量数据包括多个元素,每个元素包括多个特征,所述装置包括:
存储有程序的存储器;以及
一个或多个处理器,所述处理器通过执行所述程序而执行以下操作:
对所述张量数据进行分解以获得核心张量;
基于所述核心张量执行第一解释算法,以确定所述多个元素中的每个元素对于每种类别的贡献分,其中,所述贡献分表示所述元素对于所述类别被确定为分类结果的贡献程度;
在所述多个元素中选择贡献分大于阈值的元素;
针对所选择的元素中的每一个,利用第二解释算法来确定所述元素中的每个特征对于每种类别的重要性分数;
基于重要性分数来选择特征,并且基于所选择的特征来构建张量数据训练样本;以及
利用构建的张量数据训练样本来训练所述分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010043527.8/1.html,转载请声明来源钻瓜专利网。