[发明专利]一种基于双向时间卷积网络的中文情感分析方法有效
申请号: | 201910289343.7 | 申请日: | 2019-04-11 |
公开(公告)号: | CN110059188B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 彭德中;任晓雷;何小林;韩建胜;陈鹏;刘杰;李俊华 | 申请(专利权)人: | 四川黑马数码科技有限公司;四川大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 646000 四川省泸*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于双向时间卷积网络的中文情感分析方法,该方法包括:1)预处理,根据编码去除文本中的非法字符,并利用分词工具对序列进行分词;2)词嵌入,将文本通过预训练词向量模型进行嵌入,生成文本向量序列;3)双向多层因果卷积层,利用多层空洞因果卷积对文本向量序列进行编码特征提取;4)线性变换,取前后向编码的最后一个状态作为该方向的语义向量,分别将它们进行线性变换映射到新的维度;5)特征融合,对经过线性变换后的前向后向语义特征进行拼接,得到综合特征向量;6)分类输出,利用融合后的特征信息来进行情感分析,通过分类器输出文本所属情感类别的概率分布。本发明提高了情感分析的正确率,捕捉文本全局信息,促进情感分类。 | ||
搜索关键词: | 一种 基于 双向 时间 卷积 网络 中文 情感 分析 方法 | ||
【主权项】:
1.一种基于双向时间卷积网络的中文情感分析方法,其特征在于:具体包括以下步骤:1)预处理,将中文繁体转为简体,根据字符Unicode编码去除文本中的非法字符,并利用分词工具对文本序列进行分词;2)词嵌入,使用fastText方法对文本进行词向量预训练,得到所有词汇的稠密词向量表达,将文本序列通过预训练词向量模型映射成向量序列;3)双向多层因果卷积层,首先在序列的左侧进行填充,利用一维空洞卷积对序列从左向右进行卷积计算,实现前向特征提取;然后将原序列翻转,按照前向的计算方式对翻转后的序列进行后向卷积计算;每一次空洞因果卷积计算后,都将参数进行层级归一化,并通过激活函数ReLU进行非线性计算,将原始输入与非线性计算之后的结果进行残差连接,整体就构成了一个空洞因果卷积模块,以上模块重复多次进行多层堆叠对文本进行编码;4)线性变换,经过多层空洞因果卷积层计算后得到的文本序列,其前向编码和后向编码的最后一个时刻所对应的状态向量作为最终的特征向量,然后分别对前向特征向量和后向特征向量进行线性变换;5)特征融合,将经过线性变换后的进行拼接,得到文本序列全局的特征信息,供后续情感分类计算;6)分类输出,利用融合后的特征信息来进行情感分析,通过softmax分类器输出文本所属情感类别的概率分布。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川黑马数码科技有限公司;四川大学,未经四川黑马数码科技有限公司;四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910289343.7/,转载请声明来源钻瓜专利网。