[发明专利]一种基于神经网络可解释性的文本分类方法在审
| 申请号: | 201911378344.5 | 申请日: | 2019-12-27 |
| 公开(公告)号: | CN111209370A | 公开(公告)日: | 2020-05-29 |
| 发明(设计)人: | 杜庆峰;徐锦程;倪奕玮;孙清志 | 申请(专利权)人: | 同济大学 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/247;G06N3/04;G06N3/08 |
| 代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 杨宏泰 |
| 地址: | 200092 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 神经网络 解释性 文本 分类 方法 | ||
本发明涉及一种基于神经网络可解释性的文本分类方法,该方法利用训练完成的文本分类模型,对输入的文本信息进行分类,所述的文本分类模型的训练步骤包括:S1)获取训练数据,训练得到待增强的文本分类模型;S2)通过神经网络解释方法对训练数据中的词语进行排序;S3)按照排序顺序,依次对各词语添加扰动;S4)在最小化扰动的约束条件下生成对抗样本,并获取对抗样本的生成成功率;S5)判断生成成功率是否低于设定阈值,若是,则完成训练并输出该文本分类模型,若否,则执行步骤S6);S6)将对抗样本加入当前训练数据作为新的训练数据,并返回执行步骤S1),与现有技术相比,本发明具有鲁棒性高等优点。
技术领域
本发明涉及深度学习技术的自然语言处理领域,尤其是涉及一种基于神经网络可解释性的文本分类方法。
背景技术
文本分类是指根据预定义的分类体系或分类标准将未标记的文本分类至其中的某一个或几个类别中。早期的分类技术主要包括基于规则模版的方法与基于机器学习的方法,近年来,随着深度学习的快速发展,基于神经网络的文本分类模型,例如FastText、TextCNN、BERT等,已经成为解决该类问题的主流方法。
随着文本分类模型被广泛部署于各种实际应用,模型的鲁棒性也开始受到越来越多的关注。由于神经网络复杂的内部运算机制以及训练数据的分布上存在的天然偏置,如果在原输入样本中添加细微的、难以分辨的扰动,生成的样本可能诱导模型产生完全不同的预测结果,这个过程被称为对抗攻击(Adversarial Attack),这些扰动后的样本被称为对抗样本(Adversarial Examples)。对抗样本的存在对模型的安全性产生了巨大威胁。
尽管已经有一些研究者开始关注文本分类模型的对抗样本,然而,当前研究尚未深入结合神经网络的可解释性问题。可解释性是指用人类可理解的方式直观展示模型的决策过程,从而深刻揭示输入变量与预测结果之间的联系,为模型调优、错误发现、预测结果的解释等提供依据。中国专利CN201910729584.9公开了一种基于可解释性对抗文本的对抗训练方法,但是其只适用于RNN模型,没有利用神经网络解释方法,其可解释性只在于生成的样本扰动方向合理,同时在添加扰动和对抗训练过程中,均采用单一的方法,无法有效提高模型的鲁棒性。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种鲁棒性强的基于神经网络可解释性的文本分类方法。
本发明的目的可以通过以下技术方案来实现:
一种基于神经网络可解释性的文本分类方法,该方法利用训练完成的文本分类模型,对输入的文本信息进行分类,所述的文本分类模型的训练步骤包括:
S1)获取训练数据,训练得到待增强的文本分类模型;
S2)通过神经网络解释方法对训练数据中的词语进行排序;
S3)按照排序顺序,依次对各词语添加扰动;
S4)在最小化扰动的约束条件下生成对抗样本,并获取对抗样本的生成成功率;
S5)判断生成成功率是否低于设定阈值,若是,则完成训练并输出该文本分类模型,若否,则执行步骤S6);
S6)将对抗样本加入当前训练数据作为新的训练数据,并返回执行步骤S1)。
进一步地,所述的步骤S2)中,神经网络解释方法对词语按照对模型当前预测结果的影响程度进行定量描述,并按照逆序排序。
优选地,所述的神经网络解释方法包括敏感度分析、基于一阶泰勒展开的显著性分析、留一法和层级间相关性传播。
进一步地,所述的步骤S3)中,对词语添加扰动的方法包括词语级别的扰动方法和/或字符级别的扰动方法。
更进一步地,所述的词语级别的扰动方法包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911378344.5/2.html,转载请声明来源钻瓜专利网。





