[发明专利]细粒度情感分析方法、装置、计算机设备及存储介质在审
申请号: | 201910796626.0 | 申请日: | 2019-08-27 |
公开(公告)号: | CN110516245A | 公开(公告)日: | 2019-11-29 |
发明(设计)人: | 吴泽宏;柯宗庆;黄佐华 | 申请(专利权)人: | 蓝盾信息安全技术股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 44245 广州市华学知识产权代理有限公司 | 代理人: | 李君<国际申请>=<国际公布>=<进入国 |
地址: | 510665 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感分析 细粒度 评论标签 评论文本 训练模型 数据集 初始模型 目标领域 向量化 源领域 情感分析数据 计算机设备 存储介质 格式数据 领域数据 数据集中 序列输入 获取源 三元组 微调 文本 输出 评论 中文 分析 | ||
本发明公开了一种细粒度情感分析方法、装置、计算机设备及存储介质,该方法包括:获取源领域数据集和目标领域数据集,源领域数据集中的每条数据为评论文本、评论标签、评论分数的三元组格式数据;搭建情感分析初始模型;将源领域数据集的评论文本序列和评论标签序列进行向量化;将向量化后的评论文本序列和评论标签序列输入情感分析初始模型进行训练,得到情感分析预训练模型;利用情感分析预训练模型在目标领域数据集上进行训练,微调情感分析预训练模型的参数,得到细粒度情感分析模型;对待分析文本进行处理,在处理后输入细粒度情感分析模型,进行细粒度情感分析,输出得到情感分析结果。本发明可以克服中文细粒度情感分析数据集缺乏的困难。
技术领域
本发明涉及一种细粒度情感分析方法、装置、计算机设备及存储介质,属于情感分析、深度学习及迁移学习领域。
背景技术
情感分析(Sentiment Analysis),又可称为意见挖掘(Opinion Mining)、意见倾向性分析(Opinion Analysis)等,是一门结合自然语言处理、数据挖掘、心理学、语言学等的交叉学科,对带有主观情感极性的信息进行判别和挖掘。情感分析按照粒度可以分为粗粒度及细粒度两大类。其中,粗粒度一般包含文档级和句子级。文档级别的情感分析是将文档作为一个整体的研究对象,分析其整体表现的情感极性,属于正向的、负向的还是中性的。句子级的情感分析比文档级的要更具体、细致,句子级情感分析在判别一个句子的情感极性之前,首先要判断该句子是属于主观句还是客观句。主观句是用户情感表达的直接句子,而客观句是陈述客观对象的句子,不含有情感极性,故其不应作为情感分析的句子。
粗粒度的情感分析虽然能够快速挖掘正负类观点,但在粗粒度范畴下忽略了对更具体方面、属性的考虑,导致情感极性判定不准确情况,也无法知道用户发表观点的主因。细粒度就是为了研究客体更具体化属性的情感分析而提出来的。细粒度的情感分析能深入地挖掘评论者对评论对象不同属性(aspect)的态度,能够表现出更具体、更多的信息,这种细粒度的评价对象也可能成为属性。例如对于餐厅点评,用户可以对餐厅的服务态度、菜品、上菜速度等多种属性进行评论,商家可以从评论的具体属性中发现用户对商家各方面的评价,从中可以发现自己的优势以及缺点,为进一步的推广、宣传以及提升自身竞争力提供有说服力的数据。细粒度情感分析固然有重要意义,但其数据集的获取和算法上更加棘手,体现在需要对每一条评论不同的属性进行合理的打标签以及对于属性的提取。
粗粒度情感分析的研究已经称为研究的热点,2016年,Wang等在细粒度情感分析中,利用注意力机制来提取评论对象的属性,然后利用长短时记忆网络(Long-Short TermMemory Network,LSTM)进行情感分析,其提出的基于词嵌入及注意力机制的模型获得较好的效果。Kai等基于语法解析树提出了一种树形LSTM,将语义信息与句法依存关系、短语构成等信息结合起来,完成短语级别情感分析。Tang等基于神经网络不能确定对某个细粒度属性更重要的上下文信息的缺点,提出了记忆网络,利用记忆网络捕捉不同上下文对于不同细粒度属性的重要性。中文的细粒度情感分析一直是一个棘手的问题,一方面是因为当前没有一个权威、公开的中文细粒度情感分析数据集,使得相关的研究非常少;另一方面是细粒度情感分析的关键是从文本中识别细粒度的属性。
发明内容
有鉴于此,本发明提供了一种细粒度情感分析方法、装置、计算机设备及存储介质,其使用的源领域数据集包括评论标签,可以为细粒度情感分析学习提供了天然的大量样本,从而克服中文细粒度情感分析数据集缺乏的困难。
本发明的第一个目的在于提供一种细粒度情感分析方法。
本发明的第二个目的在于提供一种细粒度情感分析装置。
本发明的第三个目的在于提供一种计算机设备。
本发明的第四个目的在于提供一种存储介质。
本发明的第一个目的可以通过采取如下技术方案达到:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于蓝盾信息安全技术股份有限公司,未经蓝盾信息安全技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910796626.0/2.html,转载请声明来源钻瓜专利网。