[发明专利]文本信息分类处理方法、电子设备及计算机可读存储介质有效
申请号: | 202010183299.4 | 申请日: | 2020-03-16 |
公开(公告)号: | CN111400452B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 徐挺洋;卞天;荣钰;黄俊洲 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/9536;G06F18/241;G06N3/0464;G06N3/08;G06Q50/00 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 信息 分类 处理 方法 电子设备 计算机 可读 存储 介质 | ||
本申请实施例公开了一种基于人工智能技术的互联网文本信息分类处理方法、电子设备及计算机可读存储介质,包括:根据目标文本信息的转发关系和回复关系,确定目标文本信息的传播结构;将传播结构输入到双向图卷积神经网络中,得到分类信息,分类信息是根据双向图卷积神经网络的目标特征信息确定出的,双向图卷积神经网络包括自顶向下结构的第一图卷积神经网络和自底向上结构的第二图卷积神经网络,目标特征信息是根据第一特征信息和第二特征信息确定出的,第一特征信息是根据传播结构确定出的第一图卷积神经网络的特征信息,第二特征信息是根据传播结构确定出的第二图卷积神经网络的特征信息;根据分类信息对目标文本信息进行分类处理。
技术领域
本申请实施例涉及互联网技术领域,具体而言,本申请涉及一种基于人工智能技术的互联网文本信息分类处理方法、电子设备及计算机可读存储介质。
背景技术
随着互联网的快速发展,社交媒体已经成为用户获取信息、表达意见的便捷在线平台。由于社交媒体使用方便且用户众多,导致社交媒体上的信息量飞速增长,飞速增长的信息量中难免存在很多谣言,给社会带来巨大危害。于是,如何快速有效地识别社交媒体上的谣言引起了广泛研究,比如基于传统的机器学习方法的谣言检测,又比如基于各种神经网络的谣言检测。
然而,本申请的发明人在具体实现过程中发现:传统的机器学习方法虽然在谣言检测问题上取得了一定效果,但其依赖人工提取特征,十分耗时费力;循环神经网络、卷积神经网络等,则忽视了谣言的传播结构所包含的特征,递归神经网络则聚合了更多来自于叶子节点的信息,这与谣言传播过程中越晚发布的帖子的信息量越少相违背,难以提高谣言检测的准确度。
发明内容
本申请实施例的目的旨在至少能解决上述的技术缺陷之一,特提出以下技术方案:
一方面,提供了一种文本信息分类处理方法,包括:
根据目标文本信息的转发关系和回复关系,确定目标文本信息的传播结构;
将传播结构输入到双向图卷积神经网络中,得到目标文本信息的分类信息,其中,分类信息是根据双向图卷积神经网络的目标特征信息确定出的,双向图卷积神经网络包括自顶向下结构的第一图卷积神经网络和自底向上结构的第二图卷积神经网络,目标特征信息是根据第一特征信息和第二特征信息确定出的,第一特征信息是根据传播结构确定出的第一图卷积神经网络的特征信息,第二特征信息是根据传播结构确定出的第二图卷积神经网络的特征信息;
根据分类信息对目标文本信息进行分类处理。
一方面,提供了一种文本信息分类处理装置,包括:
第一确定模块,用于根据目标文本信息的转发关系和回复关系,确定目标文本信息的传播结构;
第一处理模块,用于将传播结构输入到双向图卷积神经网络中,得到目标文本信息的分类信息,其中,分类信息是根据双向图卷积神经网络的目标特征信息确定出的,双向图卷积神经网络包括自顶向下结构的第一图卷积神经网络和自底向上结构的第二图卷积神经网络,目标特征信息是根据第一特征信息和第二特征信息确定出的,第一特征信息是根据传播结构确定出的第一图卷积神经网络的特征信息,第二特征信息是根据传播结构确定出的第二图卷积神经网络的特征信息;
第二处理模块,用于根据分类信息对目标文本信息进行分类处理。
在一种可能的实现方式中,根据传播结构确定第一图卷积神经网络的特征信息,得到第一特征信息是通过第一特征确定模块实现的,第一特征确定模块用于:
确定传播结构的第一邻接矩阵和特征矩阵,第一邻接矩阵包括传播结构中从上层节点到下层节点之间的各个边,特征矩阵包括传播结构中每个节点的特征向量,每个节点的特征向量为该每个节点对应的文本的词向量的词频逆文本频率值;
对第一邻接矩阵中的部分边进行丢弃,得到第二邻接矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010183299.4/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置