[发明专利]一种基于异构图神经网络的纪检线索多标签分类方法在审

专利信息
申请号: 202210242287.3 申请日: 2022-03-11
公开(公告)号: CN114722192A 公开(公告)日: 2022-07-08
发明(设计)人: 陈俊杰;高静;左东石;樊昊 申请(专利权)人: 内蒙古农业大学
主分类号: G06F16/35 分类号: G06F16/35;G06N3/04;G06N3/08
代理公司: 北京汇智英财专利代理事务所(普通合伙) 11301 代理人: 杨瑞华
地址: 010018 内蒙古自治区呼和浩特市*** 国省代码: 内蒙古;15
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 构图 神经网络 纪检 线索 标签 分类 方法
【说明书】:

本申请公开了一种基于异构图神经网络的纪检线索多标签分类方法,构建并利用基于文本异构图的文本多标签分类模型进行分类,提高分类效率。对文本进行预处理,并构建异构图结构。将异构图结构中的不同类型的节点的向量表示初始化,将得到的节点向量表示和异构图结构输入异构图神经网络,并将得到的句子节点向量表示输入BILSTM神经网络,获得的内容向量表示和句子节点向量表示通过注意力机制后输入全连接网络,输出标签分类结果,从而实现针对不同边信息和节点类型信息进行节点更新。解决了现有的纪检线索多标签分类方法存在的分类效率较低,限制了文本的表示能力以及不能根据不同边信息和节点类型信息进行节点更新的技术问题。

技术领域

本申请属于文本多标签分类技术领域,尤其涉及一种基于异构图神经网络的纪检线索多标签分类方法。

背景技术

纪检线索是由纪检监察机关受理的反映党组织、党员和行政监察对象涉嫌违犯党的纪律、行政纪律和国家法律法规的线索材料。主要包括:领导批转的信访案件线索;各级纪检监察组织在办案过程中,发现的有关单位或个人涉嫌违纪的线索;各镇(区、街道、中心社区)、区直部门、司法机关报送的线索;其他方面收集、掌握的涉案信息等。纪检线索的管理方式通常为在区纪委案管室设立案件线索储备库,确定专人管理,具体负责案件线索的收集、登记、分类、归档等工作。现有技术中,对纪检线索进行多标签分类方法多为采用人工针对文本进行多标签分类,效率较低,大量耗费了纪检监察干部人力。现有的基于图神经网络的分类方法对文本进行多标签分类,但没有将文本的句法信息、语义信息和结构信息进行综合考虑,文本的向量表示没有充分融合多种信息,限制了文本的表示能力;同时,缺乏针对不同边信息和节点类型信息的节点更新方法,导致文本多标签分类结果不理想。

发明内容

本申请提供了一种基于异构图神经网络的纪检线索多标签分类方法,用以解决现有的纪检线索多标签分类方法存在的分类效率较低,限制了文本的表示能力以及不能根据不同边信息和节点类型信息进行节点更新的技术问题。

有鉴于此,本申请提供了一种基于异构图神经网络的纪检线索多标签分类方法,包括:

构建基于文本异构图的文本多标签分类模型,基于文本异构图的文本多标签分类模型包括异构图神经网络、BILSTM神经网络、基于注意力机制的文本表示模块和全连接网络;

对文本进行预处理,构建文本的异构图结构,获得异构图结构的节点、边及边的权重,按照节点和边的关系建立邻接矩阵;

将异构图结构中的不同类型的节点的向量表示初始化,得到初始向量表示;

将节点向量表示和异构图结构输入异构图神经网络,得到句子节点向量表示;

将句子节点向量表示按句子的顺序输入BILSTM神经网络,得到文本的内容向量表示;

通过内容向量表示和句子节点向量表示的基于注意力机制的文本表示模块,获得句子在文本表示中的权重,并获得文本向量表示;

将文本向量表示输入全连接网络,输出标签分类结果。

可选地,对文本进行预处理,包括:

对文本进行分词、分句、去除停用词,对文本进行句法分析,并计算文本中词语的语义相似度,获得文本的单词集合和句子集合。

可选地,对文本进行分词、分句、去除停用词,对文本进行句法分析,并计算文本中词语的语义相似度,获得文本的单词集合和句子集合,包括:

对文本进行分词、分句、去除停用词,对文本中的每个句子使用句法依赖工具进行句法分析,对每个句子的词语按共现信息进行结构分析,对文本中的词语按照Emebedding的词向量计算词语之间的语义距离,获得文本的单词集合和句子集合。

可选地,节点包括由句子集合内的句子转换成的句子节点和由单词集内的词语转换成的词语节点。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古农业大学,未经内蒙古农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210242287.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top