[发明专利]一种基于特定领域情感词的文档级情感分析方法有效
申请号: | 201810485193.2 | 申请日: | 2018-05-21 |
公开(公告)号: | CN108804417B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 田刚;王芳;孙承爱;李堂军;任艳伟 | 申请(专利权)人: | 山东科技大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/216;G06F16/35;G06K9/62 |
代理公司: | 青岛智地领创专利代理有限公司 37252 | 代理人: | 肖峰 |
地址: | 266590 山东省青岛*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于特定领域情感词的文档级情感分析方法,按如下顺序进行:收集文档数据集,使用Skip‑gram词向量模型训练原型单词的集合,得到每个原型单词对应的词向量,并利用注意力机制对词向量进行重组,捕获词向量中非连续词之间的关系;分别使用非对称卷积神经网络和基于注意力机制的双向门循环神经网络对词和句子进行合成,形成文档向量特征;利用Skip‑gram词向量模型的领域情感词典,生成情感特征向量;最后,利用线性结合层将文档向量特征和情感特征向量相结合,形成有利于文档分类的文档特征。情感分析被广泛应用于产品分析、商品推荐、股票价格趋势预测等,本发明提供的方法能准确、高效地对文档进行情感分析,具有很大的商业价值。 | ||
搜索关键词: | 一种 基于 特定 领域 情感 文档 分析 方法 | ||
【主权项】:
1.一种基于特定领域情感词的文档级情感分析方法,其特征在于,包括以下步骤:步骤1:收集文档数据集,得到原型单词的集合,使用Skip‑gram词向量模型训练原型单词的集合,得到每个原型单词对应的词向量,并利用注意力机制对词向量进行重组,以捕获词向量中非连续词之间的关系;文档由句子组成,句子由词组成,利用非对称卷积神经网络对词进行合成,利用基于注意力机制的双向门循环神经网络对句子进行合成,最终形成文档向量特征;步骤2:建立一种基于Skip‑gram词向量模型的领域情感词典,以生成情感特征向量;步骤3:利用线性结合层将步骤1得到的文档向量特征与步骤2生成的情感特征向量相结合形成文档特征,并且通过softmax函数接收文档张量,最后输出文档的情感类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东科技大学,未经山东科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810485193.2/,转载请声明来源钻瓜专利网。