[发明专利]谣言检测方法及设备有效
申请号: | 201810198553.0 | 申请日: | 2018-03-12 |
公开(公告)号: | CN108491480B | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 周凯敏;何永;李传丰;武拥珍;舒畅;刘杰汉 | 申请(专利权)人: | 义语智能科技(上海)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 王奎宇;甘章乖 |
地址: | 201203 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 谣言 检测 方法 设备 | ||
1.一种谣言检测方法,其中,该方法包括:
数据采集模块,监听采集相关帖子,包括目标对象发布的社交媒体的消息以及消息下的转发和评论内容,并按照固定的帖子条数采集一个序列的信息交由数据处理模块处理,同时若一段时间内没有新消息,则就将目前采集到的帖子作为一个序列的信息交由所述数据处理模块处理;
数据处理模块,从数据采集模块接收各个序列的信息,将每个序列的信息进行数据清洗后,再进行文本数值化处理得到消息矩阵,并将消息矩阵发送给谣言判别决策模块;
谣言判别决策模块,从所述数据处理模块依次接收各个消息矩阵,并将每一个消息矩阵经过卷积神经网络和max pooling单元,将每一个消息矩阵转换为一个对应的矩阵向量;预设GRU单元的初始状态为0向量,依次向所述GRU单元输入一个消息矩阵,所述GRU单元依照当前输入的消息矩阵和前一个GRU单元状态更新GRU单元的状态;依次记录更新得到的GRU单元状态,并依次将更新得到的GRU单元状态经过全连接神经网络,并通过softmax输出,以计算得到能判断和不能判断谣言的概率;若向所述GRU单元继续输入某一个消息矩阵后,对应计算得到的所述能判断谣言的概率大于预设阈值,则结束向所述GRU单元继续输入下一个消息矩阵,将最后一次更新的GRU单元状态发送给谣言判别模块处理;
所述谣言判别模块,将最后一次更新的谣言GRU单元状态,经过全连接神经网络,并通过softmax输出,以计算得到所述采集的消息是否为谣言的概率;
结果记录模块,记录下所述帖子和对应的计算得到的消息是否为谣言的概率。
2.根据权利要求1所述的方法,其中,所述数据清洗包括:
先将每个序列的信息中的非中文的内容去除后,再对每个序列的剩余信息进行分词和去除停用词,得到每个序列对应的词序列;预设一个最大词长度,计算每个词序列中各个词的TF-IDF值,若某个词序列中的词的个数超过所述最大词长度,则在该词序列中保留所述TF-IDF值高于预设阈值的词,以得到保留后的词序列。
3.根据权利要求2所述的方法,其中,所述进行文本数值化处理,包括:
用word2vec训练的词向量,将所述词序列或保留后词序列中的给个词转化为对应的词向量,按所述词序列或保留后词序列的词的顺序,将对应的词向量依次并列连接起来形成一个消息矩阵,其中,不足所述最大词长度的词序列或保留后词序列,对应的消息矩阵中用0向量填充。
4.根据权利要求1所述的方法,其中,记录每次更新得到的GRU单元状态,将每次更新得到的GRU单元状态经过全连接神经网络,并通过softmax输出,以计算得到能判断和不能判断谣言的概率之后,还包括:
若不能判断谣言的概率大于预设阈值,则等待向所述GRU单元输入下一个消息矩阵,更新得到GRU单元状态,并记录每次更新得到的GRU单元状态,将每次更新得到的GRU单元状态经过全连接神经网络,并通过softmax输出,以重新计算得到能判断和不能判断谣言的概率,
直至计算得到当前一个消息矩阵的输入对应的能判断谣言的概率大于预设阈值,则结束等待,将最后一次更新的谣言GRU单元状态发送给谣言判别模块处理,
或者直至所述等待下一个消息矩阵的输入的时间超过预设的最晚判断时间,则结束等待,将最后一次更新的谣言GRU单元状态发送给谣言判别模块处理。
5.根据权利要求1所述的方法,其中,所述谣言判别决策模块从所述数据处理模块依次接收各个消息矩阵,并将每一个消息矩阵经过卷积神经网络和max pooling单元,将一个消息矩阵转换为一个对应的矩阵向量之前,还包括:
采用带有预先标准结果的谣言数据,首先训练所述谣言判别模块,之后训练所述谣言判别决策模块与训练所述谣言判别模块交替进行,其中,采用分类模型的训练方式训练所述谣言判别模块,采用deep Q-Learning的训练方式训练所述谣言判别决策模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于义语智能科技(上海)有限公司,未经义语智能科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810198553.0/1.html,转载请声明来源钻瓜专利网。