[发明专利]一种基于词块的观点目标抽取和目标情感分类联合方法及系统有效
申请号: | 201910671527.X | 申请日: | 2019-07-24 |
公开(公告)号: | CN110569355B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 虎嵩林;周艳;朱福庆;韩冀中 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F40/289 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邵可声 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 观点 目标 抽取 情感 分类 联合 方法 系统 | ||
1.一种基于词块的观点目标抽取和目标情感分类联合方法,包括如下步骤:
把需要进行观点目标抽取和目标情感分类的句子进行处理,得到每个句子中所有的连续词块;
把得到的句子信息以及词块信息输入到观点目标抽取和目标情感分类的联合模型中,得到句子中每一词块对应的各类别概率分布;
根据每一词块对应的各类别概率分布,获取句子中的观点目标及其对应的情感类别;
其中,所述观点目标抽取和目标情感分类的联合模型的构建方法,包括:
(1)获取训练数据输入句子中每一个词的词类别标签与每一词块的词块类别标签,并将数量数据输入句子及相应词块信息输入联合模型;
(2)利用通过word2vec训练得到的词向量矩阵与预训练好的语言模型,分别将每个词映射成传统词向量与基于上下文的词向量,并进行向量拼接,以生成每个词对应的词向量;
(3)基于每个词对应的词向量、词类别标签及词块信息,联合模型输出各词块对应的各类别概率分布;
(4)基于各类别概率分布与相应的词块类别标签计算交叉熵损失函数的值来进行反向梯度传播,获取模型参数,以构建观点目标抽取和目标情感分类的联合模型。
2.如权利要求1所述一种基于词块的观点目标抽取和目标情感分类联合方法,其特征在于,联合模型的构建方法步骤(1)具体方法包括:
(1-1)设定词块的最大长度值,枚举训练数据输入句子中不超过所设定的最大长度的所有连续文本词块;所述最大长度值N的设定范围为1≤N≤L,其中,N为整数,L为输入句子的最大长度;
(1-2)定义词块的类别集合为4个类别{TPOS,TNEG,TNEU,O},其中,TPOS表示词块是观点目标且其情感倾向是积极的,TNEG表示词块是观点目标且其情感倾向是消极的,TNEU表示词块是观点目标且其情感倾向是中性的,O表示词块不是情感目标;根据标注语料中句子标注的观点目标以及目标情感分类,为所有的词块标记类别。
3.如权利要求2所述一种基于词块的观点目标抽取和目标情感分类联合方法,其特征在于,训练数据输入句子X={w1,w2,...,wt...,wT},其中wt表示输入句子中的第t个词;模型的目标是预测词块集合中每个词块的类别Y={(i,J,l)|1≤i≤j≤T;j-i+1≤L;l∈C},其中i,j表示词块在句子中的起始位置和终止位置,l表示词块对应的标签,C表示词块的类别集合。
4.如权利要求3所述一种基于词块的观点目标抽取和目标情感分类联合方法,其特征在于,通过以下步骤获取各词块对应的各类别概率分布:
3-1)在上下文表示层,把句子中每个词对应的词向量作为输入,采用多层双向长短记忆神经网络学习句子中每个词的上下文表示向量;
3-2)每个词块采用两种词块级别的信息来对其进行表示:一种是词块的边界信息,一种是词块的整体信息;
3-3)基于词块的注意力机制用来计算输入句子中和每个词块相关联的上下文中的情感信息;
3-4)在输出层把每个词块的向量表示以及基于词块注意力机制的上下文情感信息表示拼接在一起,获取各词块对应的各类别概率分布。
5.如权利要求4所述一种基于词块的观点目标抽取和目标情感分类联合方法,其特征在于,步骤3-1)中所述的上下文表示为:
其中,表示第m层中第t个隐藏单元的状态,第M层的隐藏层状态作为每个词的上下文表示,其中m∈{1,…,M},M为多层双向长短记忆神经网络的层数。
6.如权利要求4所述一种基于词块的观点目标抽取和目标情感分类联合方法,其特征在于,步骤3-2)中所述边界信息用边界词对应的stack BiLSTM层的输出来进行表示;所述整体信息采用词块中所有词的上下文信息和进行表示;任意一个词块(i,j)词块表示为:
其中,是多层双向长短记忆神经网络的输出,这两类信息的表示向量拼接起来来作为词块的表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910671527.X/1.html,转载请声明来源钻瓜专利网。