[发明专利]基于嵌套LSTM的水军评论检测方法及系统在审
申请号: | 201911085552.6 | 申请日: | 2019-11-08 |
公开(公告)号: | CN110825952A | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 廖祥文;温宇含;陈志豪;邓立明;陈开志 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/33;G06N3/04 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈明鑫;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 嵌套 lstm 水军 评论 检测 方法 系统 | ||
本发明涉及一种基于嵌套LSTM的水军评论检测方法,包括以下步骤:步骤S1:将输入的数据分为文本信息与行为信息;步骤S2:对行为信息进行特征抽取获得行为特征,并将文本信息送入所述文本特征提取模块,得到包含上下文信息的文本特征;步骤S3:将得到的包含上下文信息的文本特征送入所述嵌套LSTM模块,并提取该文本特征的空间结构信息,得到包含整体与部分关系的文本特征;步骤S4:将包含整体与部分关系的文本特征与行为特征输入至集成学习模块中,得到评论最终的分类结果。本发明能够抽取出有效特征,并对特征进行抽象和组合,最终识别出文本空间特征。
技术领域
本发明涉及情感分析和观点挖掘领域,特别是一种基于嵌套LSTM 的水军评论检测系统及方法。
背景技术
当前,有很多技术方法可用于水军评论检测。传统的检测方法单 纯从文本分类的角度出发,很难确定评论上下文语义的不同。区别于 传统的文本分类方法,如何学习长期的依赖关系,进行针对水军评论 的文本分类,是水军评论检测的问题关键。传统的研究工作主要是基 于传统神经网络的方法,该方法通过不断地提取特征,从局部的特征 到总体的特征,使用支持向量机(SVM)分类器进行分类。这一类基 于特征工程与浅层线性模型的方法虽然取得了一定的成效,但是耗时 较长,需要回传的残差会指数下降,导致网络权重更新缓慢,无法体 现出长期记忆的效果。
当前,随着深度学习的快速发展,基于多层神经网络的表示学习 模型在语义表示与情感分析运用方面更具优势。许多研究者们也将这 些模型用于水军评论的分类。在嵌套LSTM中,LSTM的记忆单元可以 访问内部记忆,使用标准的LSTM门选择性地进行读取、编写。相比 于传统的堆栈LSTM,这一关键特征使得模型能实现更有效的时间层 级。在嵌套LSTM中,(外部)记忆单元可自由选择读取、编写的相 关长期信息到内部单元。相比之下,在堆栈LSTM中,高层级的激活 (类似内部记忆)直接生成输出,因此必须包含所有的与当前预测相关的短期信息。换言之,堆栈LSTM与嵌套LSTM之间的主要不同是, 嵌套LSTM可以选择性地访问内部记忆。这使得内部记忆免于记住、 处理更长时间规模上的事件,即使这些事件与当前事件不相关。
当前,水军评论方法未充分利用文本中的长期时间规模的信息, 无法有效地挖掘出潜在的观点信息。近年来,得到了国内外许多学者 和研究机构的高度重视,水军评论检测分类利用了文本中不同信息, 进行文本分类,能够站在数据使用者的角度进行分析,提供更加细粒 度的信息,有效提高水军评论检测的分析结果的准确程度,有助于研 判人员更加了解人们对热点话题、组织、产品等各种实体的真实观点 和看法,为研判人员提供更加有效而准确的信息。这就对水军评论检 测技术提出了一个挑战:如何构建一个有效的水军评论检测系统来满 足其需要。
发明内容
有鉴于此,本发明的目的在于提供一种基于嵌套LSTM的水军评 论检测方法及系统,能够自动抽取出有效特征,并对特征进行抽象和 组合,最终识别出文本空间特征。
为实现上述目的,本发明采用如下技术方案:
一种基于嵌套LSTM的水军评论检测方法,包括以下步骤:
步骤S1:将输入的数据分为文本信息与行为信息;
步骤S2:对行为信息进行特征抽取获得行为特征,并将文本信息 送入所述文本特征提取模块,得到包含上下文信息的文本特征;
步骤S3:将得到的包含上下文信息的文本特征送入所述嵌套 LSTM模块,并提取该文本特征的空间结构信息,得到包含整体与部 分关系的文本特征;
步骤S4:将包含整体与部分关系的文本特征与行为特征输入至 集成学习模块中,得到评论最终的分类结果。
进一步的,所述文本特征提取模块利用开源的Glove工具事先在 大语料里训练得到词向量表,将输入的数据的文本信息用向量表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911085552.6/2.html,转载请声明来源钻瓜专利网。