[发明专利]基于深度迁移网络的投诉举报可信度分析方法在审
申请号: | 202110310932.6 | 申请日: | 2021-03-23 |
公开(公告)号: | CN113064967A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 范青武;韩华政 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/289;G06K9/62;G06N3/04 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 迁移 网络 投诉 举报 可信度 分析 方法 | ||
本发明公开了一种基于深度迁移网络的投诉举报可信度分析方法,属人工智能技术领域。具体包括以下步骤:首先,微博文本、投诉举报文本、微博文本混合投诉举报文本分别经过Word2vec文本向量化模型表示为矩阵;然后,将向量化之后的文本输入到三组双向LSTM网络中进行特征提取,分别提取出源域私有特征向量、源域目标域共享特征向量、目标域私有特征向量;接着,将共享特征分别与源域和目标域私有特征通过自注意力机制进行特征融合,得到最终的源域特征和目标域特征;最后,将源域特征和目标域特征输入到多层感知机输出最后的分类结果。该方法解决了投诉举报可信度分析中人工分析难、缺乏有效数据标注的问题,为环境类投诉举报可信度分析提供了思路。
技术领域
本发明涉及一种环境类投诉举报可信度分析方法,尤其涉及一种基于深度迁移网络的环境类投诉举报可信度分析方法。
背景技术
环境类投诉举报是指公民对影响自身生产生活或者违反国家相关规定的环境类污染现象或者事件进行投诉。投诉者通常以文本的形式对投诉举报进行描述。在诸多的投诉举报事件中存在对事实进行篡改、夸大或者嫁接的非可信的投诉举报事件。这些投诉举报会直接提高管理部们处理水污染事件的难度,降低行政效率。为提高行政管理效率,避免管理资源浪费,行政管理部门迫切需要对网民投诉举报事件的可信度进行分析。
目前在水环境投诉举报领域少见对投诉举报事件进行可信度分析的相关工作,基于投诉举报文本进行投诉举报可信度分析的相关工作也相对较少。但是在其他领域存在基于文本内容进行可信度分析类似的工作。深度学习出现后,各种基于深度学习技术的方法被提出,在基于文本内容的可信度分析工作中取得的非常好的效果,如虚假新闻检测、谣言检测等。但是机器学习和深度学习方法大多需要基于大量含有可信度标签的数据。环境类投诉举报可信度分析中的投诉举报文本数据往往缺乏可信度标签,而人工对投诉举报进行可信度分析是非常困难的。
为了解决上述问题,使用微博文本辅助投诉举报可信度分析。微博文本和投诉举报文本都是对作者情感和态度的表达,同时微博谣言和虚假投诉举报往往都是对事实的篡改和扭曲,所以微博文本和投诉举报文本具有一定的语义相似性;结合半监督迁移学习方法,利用迁移学习理论使用特征迁移、领域适配等技术将微博文本中的知识迁移到投诉举报文本可信度分析过程中,提升投诉举报可信度分析的性能指标。
综上所述,基于深度迁移网络的环境类投诉举报可信度分析是一项创新的研究问题,具有重要的研究意义和应用价值。
发明内容
本发明的目的是解决环境类投诉举报可信度分析中人工分析困难和缺少有效可信度标签,无法训练有效的可信度分析模型的问题。为解决上述问题提出了一种深度迁移网络。本方法以微博文本为源域,投诉举报文本为目标域,设计有效的特征抽取、特征迁移和领域适配方法,利用微博文本辅助投诉举报可信度分析。
基于深度迁移网络的环境类投诉举报可信度分析方法,该方法步骤如下:
S1数据收集;
S2对微博文本数据(源域)和投诉举报文本数据(目标域)进行预处理;
S3将预处理后的文本输入到Word2vec模型中进行词向量训练,生成词向量;
S4对微博文本词向量和投诉举报文本词向量进行编码,分别设计源域特征编码器、领域共享特征编码器和目标域特征编码器抽取源域私有特征、领域共享特征、目标域私有特征;
S5领域特征融合:使用自注意力方法将源域私有特征和领域共享特征进行特征融合,得到源域特征;使用自注意力方法将目标域私有特征和领域共享特征进行特征融合,得到目标域特征。
S6计算源域特征和目标域特征的MK-MMD距离,对源域特征和目标域特征进行特征变换,完成领域适配。
S7将源域特征和目标域特征通过多层感知机网络得出分类结果。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110310932.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种化工原料生产用尾气处理装置
- 下一篇:流场成像的测量系统和主系统