[发明专利]情感原因子句标签的抽取方法、装置、设备及存储介质在审
| 申请号: | 202010673630.0 | 申请日: | 2020-07-15 |
| 公开(公告)号: | CN111859957A | 公开(公告)日: | 2020-10-30 |
| 发明(设计)人: | 刘晶;孟凯;覃俊;李子茂;宋中山;夏梦;廖立婷 | 申请(专利权)人: | 中南民族大学 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06N3/04 |
| 代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 晏波 |
| 地址: | 430074 湖北省武汉*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 情感 原因 子句 标签 抽取 方法 装置 设备 存储 介质 | ||
1.一种情感原因子句标签的抽取方法,其特征在于,所述方法包括以下步骤:
获取目标文档的候选情感原因子句和情感描述子句,并分别对所述候选情感原因子句和所述情感描述子句进行分词,获得对应的情感原因词汇集和情感描述词汇集;
将所述情感原因词汇集和所述情感描述词汇集输入至预设双向长短期记忆网络中进行编码处理,以获得情感原因特征和情感描述特征;
将所述情感原因特征和所述情感描述特征输入至预设自注意力模型,以获得情感原因自注意力信息和情感描述自注意力信息;
获取所述候选情感原因子句的相邻子句对应的目标相邻特征;
对所述情感原因自注意力信息、所述情感描述自注意力信息以及所述目标相邻特征进行连接,获得特征连接信息,并对所述特征连接信息进行分类处理,获得情感原因子句标签。
2.如权利要求1所述的方法,其特征在于,所述获取目标文档的候选情感原因子句和情感描述子句,并分别对所述候选情感原因子句和所述情感描述子句进行分词,获得对应的情感原因词汇集和情感描述词汇集的步骤之前,还包括:
从预设数据集中提取预设情感原因子句和预设情感描述子句之间的相对位置,并获取所述相对位置对应的位置特征;
相应地,所述获取目标文档的候选情感原因子句和情感描述子句,并分别对所述候选情感原因子句和所述情感描述子句进行分词,获得对应的情感原因词汇集和情感描述词汇集的步骤,具体包括:
基于所述位置特征获取目标文档的候选情感原因子句和情感描述子句,并分别对所述候选情感原因子句和所述情感描述子句进行分词,获得对应的情感原因词汇集和情感描述词汇集。
3.如权利要求2所述的方法,其特征在于,所述从预设数据集中提取预设情感原因子句和预设情感描述子句之间的相对位置,并获取所述相对位置对应的位置特征的步骤,具体包括:
从预设数据集中提取预设情感原因子句和预设情感描述子句之间的相对位置,通过位置嵌入矩阵将所述相对位置转换为位置向量;
将所述位置向量通过线性整流函数进行非线性变换,获得非线性数据;
对所述非线性数据进行线性变换,获得对应的位置特征。
4.如权利要求2所述的方法,其特征在于,所述将所述情感原因词汇集和所述情感描述词汇集输入至预设双向长短期记忆网络中进行编码处理,以获得情感原因特征和情感描述特征的步骤,具体包括:
通过Word2vec模型将所述情感原因词汇集映射为情感原因向量;
将所述情感原因向量输入至预设双向长短期记忆网络中进行编码处理,以获得正向情感原因向量和反向情感原因向量;
基于所述正向情感原因向量、所述反向情感原因向量以及所述位置特征生成情感原因特征;
通过所述Word2vec模型将所述情感描述词汇集映射为情感描述向量;
将所述情感描述向量输入至所述预设双向长短期记忆网络中进行编码处理,以获得正向情感描述向量和反向情感描述向量;
基于所述正向情感描述向量和所述反向情感描述向量生成情感描述特征。
5.如权利要求1所述的方法,其特征在于,所述将所述情感原因特征和所述情感描述特征输入至预设自注意力模型,以获得情感原因自注意力信息和情感描述自注意力信息的步骤,具体包括:
将所述情感原因特征输入至预设自注意力模型中分别与查询矩阵、键值矩阵以及值矩阵相乘,获得对应的情感原因查询向量、情感原因键值向量以及情感原因值向量,并将所述情感描述特征输入至所述预设自注意力模型中分别与所述查询矩阵、所述键值矩阵以及所述值矩阵相乘,获得对应的情感描述查询向量、情感描述键值向量以及情感描述值向量;
将所述情感原因查询向量、所述情感原因键值向量以及所述情感描述键值向量输入至softmax层中进行评分,获得情感原因评分结果,并将所述情感描述查询向量、所述情感描述键值向量以及所述情感原因键值向量输入至所述softmax层中进行评分,获得情感描述评分结果;
基于所述情感原因评分结果和所述情感原因值向量生成情感原因自注意力信息,并基于所述情感描述评分结果和所述情感描述值向量生成情感描述自注意力信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南民族大学,未经中南民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010673630.0/1.html,转载请声明来源钻瓜专利网。





