[发明专利]模型训练的处理方法、装置、设备和存储介质在审
| 申请号: | 202011467765.8 | 申请日: | 2020-12-14 |
| 公开(公告)号: | CN112580780A | 公开(公告)日: | 2021-03-30 |
| 发明(设计)人: | 周雨豪;范力欣 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨俊辉;臧建明 |
| 地址: | 518027 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 处理 方法 装置 设备 存储 介质 | ||
本发明公开了一种模型训练的处理方法、装置、设备和存储介质,所述方法包括:在对深度学习模型的训练时,对原始卷积神经网络模型进行迭代训练过程中,根据采样间隔获取多个中间模型的特征提取器的输出以及分类器的输出,基于每个中间模型的输出,分别获取每个中间模型对训练集中的每种特征的信息增益,稀疏性参数以及完备性参数,然后针对中间模型的输出进行树模型训练,得到解释模型,基于解释模型可以得到每个中间模型对应的分类准确度,以及树完备性参数,再将获取到的每个中间模型对应的各种指标输出,从而可以基于这些参数确定模型在训练过程中的训练程度,可以对不同训练阶段的模型对特征的处理情况以及变化情况进行量化解释。
技术领域
本发明涉及人工智能领域,尤其涉及一种模型训练的处理方法、装置、设备和存储介质。
背景技术
卷积神经网络模型(Convolution Neural Networks,CNNs)是一种深度学习模型,在图像识别等领域中具有非常出色的性能,得到了广泛应用。CNNs主要由卷积部分和全连接部分组成。其中卷积部分包含卷积层、激活函数层和池化层等,作用是提取数据的特征;全连接部分的作用是连接特征和输出计算损失,并进行识别和分类等操作。
然而,由于深度学习模型端到端的学习策略和极其复杂的模型参数结构,CNNs一直如同黑盒一般令人难以理解和解释其中的工作原理。CNNs经过训练收敛后,用户在使用中仅能得到模型的最终输出结果(如输入所属的类别等),却无法理解CNNs是如何从原始输入得到预测输出的。这种难以解释性使得当前CNNs等深度学习模型在无人驾驶、医疗图像识别等领域的落地遭遇了很大阻碍。
综上所述,目前已有的解释性模型,缺乏对模型训练过程的量化评价标准,并且缺乏对于黑盒模型的实时解释,以对黑盒模型的训练过程/训练程度进行实时评估,导致无法在模型训练时调整训练策略或特征工程。
发明内容
本发明的主要目的在于提供一种模型训练的处理方法、装置、设备和存储介质,用于获取深度学习模型训练过程中的量化评价标准,进一步了解模型的训练过程中的学习情况的变化。
为实现上述目的,本发明提供一种模型训练的处理方法,包括:
在对原始卷积神经网络模型的迭代训练过程中,根据预设采样间隔获取在迭代训练过程中的多个中间模型的特征提取器的输出和分类器的输出;
针对每个中间模型,根据获取到的所述中间模型的特征提取器的输出和分类器的输出,获取在所述中间模型对训练集中的每种特征的信息增益,稀疏性参数以及完备性参数;其中,每种特征的信息增益用于表示所述特征区分数据样本的能力,每种特征的稀疏性参数用于表示特征之间的独立程度,每种特征的完备性参数用于表示所述特征对所述深度学习模型的影响程度;
针对每个中间模型,将所述中间模型的特征提取器的输出以及分类器的输出作为训练数据进行树模型训练,得到解释模型;
对每个中间模型对应的解释模型的叶节点的分类准确度进行测量,得到树准确度,所述树准确度用于指示所述解释模型的分类准确度;
计算每个中间模型对应的解释模型的每个叶节点能够正确分类的样本占所有样本中对应类别样本的数量比,得到树完备性参数;
输出每个中间模型对应的每种特征的信息增益,每种特征的稀疏性参数,每种特征的完备性参数,树准确度以及树完备性参数。
在一种具体实施方式中,所述方法还包括:
对每个中间模型对应的每种特征的信息增益,每种特征的稀疏性参数,每种特征的完备性参数,树准确度以及树完备性参数进行可视化处理,得到针对所述中间模型进行评估的可视化结果;
输出每个中间模型对应的所述可视化结果。
在一种具体实施方式中,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011467765.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:推送式电线剥皮方法
- 下一篇:基于微波射频环回的故障检测系统及方法





