[发明专利]一种基于双向时间卷积网络的中文情感分析方法有效
申请号: | 201910289343.7 | 申请日: | 2019-04-11 |
公开(公告)号: | CN110059188B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 彭德中;任晓雷;何小林;韩建胜;陈鹏;刘杰;李俊华 | 申请(专利权)人: | 四川黑马数码科技有限公司;四川大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 646000 四川省泸*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 双向 时间 卷积 网络 中文 情感 分析 方法 | ||
一种基于双向时间卷积网络的中文情感分析方法,该方法包括:1)预处理,根据编码去除文本中的非法字符,并利用分词工具对序列进行分词;2)词嵌入,将文本通过预训练词向量模型进行嵌入,生成文本向量序列;3)双向多层因果卷积层,利用多层空洞因果卷积对文本向量序列进行编码特征提取;4)线性变换,取前后向编码的最后一个状态作为该方向的语义向量,分别将它们进行线性变换映射到新的维度;5)特征融合,对经过线性变换后的前向后向语义特征进行拼接,得到综合特征向量;6)分类输出,利用融合后的特征信息来进行情感分析,通过分类器输出文本所属情感类别的概率分布。本发明提高了情感分析的正确率,捕捉文本全局信息,促进情感分类。
技术领域
本发明属于自然语言处理及深度学习领域,具体涉及一种基于双向时间卷积网络的中文情感分析方法。
背景技术
随着互联网的快速发展,出现了各种各样的网络平台使网民可以更加便捷地发表自己对某一事件的看法和对所接受到的服务进行评论,这些带有情感色彩的评论信息表达了人们不同类型的情感倾向。对于商家而言,这些情感倾向在做市场调研和产品评估时能作为评价指标,为产品研发和升级提供方向;对于用户而言,可以通过浏览这些评论来了解大众舆论对某一产品的看法,以此决定自己是否购买该产品。然而由于网络中评论数据规模庞大,单纯依靠人力难以从大量文本中分析出用户情感倾向。文本情感分析就旨在帮助我们从文本中挖掘用户的情感信息,通过对文本的分析和推理,识别出给定文本的情感极性或情感强度。
近年来,在大量数据积累和并行计算高速发展这两个重要前提之下,深度学习在自然语言处理领域的多个方面,如中文分词、文本分类、机器翻译、机器阅读理解等,都取得了突破性的进展。同样,在文本情感分析任务中,深度学习也展现出了巨大的潜力。有研究者利用长短期记忆网络(LSTM,Long Short Term Memory)在多种不同任务上进行模型训练,以此提高模型编码层的特征提取能力,然后在具体情感分析数据上进行模型参数调整,得到相应的情感分类输出。此外,在LSTM的基础上引入了注意力机制,通过关注文本中被评论的对象、评论词等能够体现情感色和情感倾向的词来实现针对具体对象的细粒度情感分析。因为回复式神经网络(RNN,Recurrent Neural Networks)计算上的串行性使得模型计算速度较慢,而卷积神经网络(CNN,Convolution Neural Networks) 不仅有较好的并行性,计算速度快,而且具有提取文本n-gram特征的能力,所以有不少研究者将CNN引入到情感分析任务中。如利用卷积神经网络对文本进行特征提取,通过不同大小的卷积核提取不同类型的n-gram特征,然后将所有提取到的特征信息融合到一起进行情感分类,或者通过卷积和动态最大值池化提取文本序列中相隔较远的词之间的语义关系,以获得文本中的长期依赖,达到更加全面的提取文本中的特征信息来对文本进行情感分析的目的。还有研究者在使用卷积神经网络对文进行建模的过程中,考虑了文本序列中词的顺序关系,对时间卷积网络进行了适当改进,使用了非线性、非连续卷积对文本进行特征提取,然后使用提取到的特征信息对文本进行情感计算。。
由此可见深度学习在文本情感分析任务中有很多的研究成果,但是基于卷积神经网络的情感分析模型中,多数模型在卷积计算时没有考虑到文本序列中词出现顺序的影响,少数模型考虑了词的前向顺序,即文本中先出现的词对后面出现的词的影响,用单向时间卷积(TCN,Temporal Convolutional Networks)提取文本特征信息,忽略了后面的词对前面的词的影响。因为文本序列后出现的词会对之前出现的词在词共现的角度存在统计学意义,所以单向时间卷积网络不足以捕捉文本序列中全部的特征信息。
发明内容
针对上述问题,本发明提供一种可以提取文本序列双向信息进行中文情感分析的双向时间卷积网络(Bi-TCN,Bidirectional Temporal Convolutional Network)方法。
为了解决上述技术问题,本发明通过以下方式来实现:
一种基于双向时间卷积网络的中文情感分析方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川黑马数码科技有限公司;四川大学,未经四川黑马数码科技有限公司;四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910289343.7/2.html,转载请声明来源钻瓜专利网。