[发明专利]一种基于深度学习的对话文本情感分析方法在审

申请号：	202211084620.9	申请日：	2022-09-06
公开（公告）号：	CN116306678A	公开（公告）日：	2023-06-23
发明（设计）人：	尚文利;殷可晴;张梦;李俊;曹忠;韦蕴珊;李淑琦	申请（专利权）人：	广州大学
主分类号：	G06F40/35	分类号：	G06F40/35;G06N3/0442;G06N3/045;G06N3/048
代理公司：	广州高炬知识产权代理有限公司 44376	代理人：	孙明科
地址：	510006 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度学习对话文本情感分析方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度学习的对话文本情感分析方法，其特征在于，包括以下步骤：

S1、对数据集进行标签归类划分；

S2、对划分好的数据集进行归一化处理；

S3、利用GRU模型对文本进行特征提取；

S4、初始化GRU模型的训练参数；

S5、训练GRU模型；

S6、输入预测语句，得出训练结果。

2.根据权利要求1所述的基于深度学习的对话文本情感分析方法，其特征在于，所述S1中，标签包括愤怒、快乐、悲伤和中立。

3.根据权利要求1所述的基于深度学习的对话文本情感分析方法，其特征在于，所述S2中，归一化处理过程包括将单词的大写转换成小写，特殊词性还原为原形，并且去除非字母数字的符号，保留问号和感叹号；采用pad机制，补齐对话的长度，使对话长度保持一致。

4.根据权利要求1所述的基于深度学习的对话文本情感分析方法，其特征在于，所述S3中，特征提取过程包括单个话语信息提取、引入注意力机制和上下文信息提取。

5.根据权利要求4所述的基于深度学习的对话文本情感分析方法，其特征在于，所述单个话语信息提取包括得到开源的词向量矩阵对输入文本进行向量化，得到单个单词w_k的嵌入序列对话集合其中L为对话数目，表示在每一个对话D_i中的N_i个话语构成的序列，u_j为由说话者s_j∈S说出的带有特定情绪c_j∈C的话语，其中s_j表示单个说话者，S表示说话者的集合，c_j表示单个话语，C表示话语的集合，w_k表示单个单词；对于第j个话语其中M_j是话语u_j中的单词数目，将对应的单个单词嵌入序列被送入低层的双向GRU模型中，从两个相反的方向学习单个话语嵌入，其两个方向的低层隐藏层状态k表示单词个数，公式如下所示：

其中一个GRU的计算过程为：

其中r_k,z_k分别为重置门与更新门；W,W_r,W_z分别为各神经元的参数，需要在训练过程中学习得到；σ为sigmoid函数；为候选隐藏状态。

6.根据权利要求4所述的基于深度学习的对话文本情感分析方法，其特征在于，所述注意力机制引用了掩码机制，对补0的位置赋予一个极小值，隐藏层状态通过一个线性变换上的tanh激活函数来产生与上下文有关的单词嵌入e_c(w_k)。

7.根据权利要求4所述的基于深度学习的对话文本情感分析方法，其特征在于，所述与上下文有关的单词嵌入e_c(w_k)通过最大池化操作来获得单个话语嵌入e(u_j)；对于i个对话所学到的单词嵌入送入高层双向GRU来捕捉上下文语境信息，被送入高级别的双向GRU中来捕获对话中话语的序列关系和上下文关系，其计算如下所示：

其中，J的值与j的值相等，j∈{1，…，j}表示话语个数，通过所述注意力机制以及tanh函数得到与上下相关的语句嵌入e_c(u_j)；最后利用softmax函数来判断语句对应的情感标签。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广州大学，未经广州大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202211084620.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种包含支架的引导RNA及利用其的遗传编辑的方法
下一篇：基于安全数字输入输出接口的数据传输方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度学习的对话文本情感分析方法在审

专利文献下载