[发明专利]一种基于机器阅读理解范式的方面级情感分析方法及系统有效
申请号: | 202110378141.7 | 申请日: | 2021-04-08 |
公开(公告)号: | CN113157920B | 公开(公告)日: | 2023-01-03 |
发明(设计)人: | 桂小林;李德福;顾迎捷;徐盼;滕晓宇;戴慧珺 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 高博 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 阅读 理解 范式 方面 情感 分析 方法 系统 | ||
本发明公开了一种基于机器阅读理解范式的方面级情感分析方法及系统,从原始数据集中提取出本方法所需的方面级情感分析数据;对提取出的方面级情感分析数据构造具有段落、问题、选项和答案形式的多项选择问答对;构建一个机器阅读理解的深度神经网络模型;将构造的多项选择问答对作为深度神经网络模型的输入,模型的输出为方面类别对应各个情感极性的概率值。本发明方法通过借鉴机器阅读理解领域中先进的解决方案,将机器阅读理解领域中的多项选择范式跨领域的应用在方面级情感分析领域。能够充分的捕捉段落、方面类别和各个情感极性之间的信息,可更好的对方面类别进行情感极性的预测,以便更好的支撑方面级情感分析的应用研究。
技术领域
本发明属于英文文本情感分析技术领域,具体涉及一种基于机器阅读理解范式的方面级情感分析方法及系统。
背景技术
随着互联网的迅猛发展以及智能手机的全面普及,网络应用向各个领域渗透。使用互联网应用已经是人们生活中必不可少的一部分,尤其在以淘宝、京东、拼多多为代表的电子商务和微信、微博为代表的社交媒体领域,月活用户远远超过其它领域。越来越多的用户在互联网上表达自己的心情、思想以及爱好,大量的用户评论数据被发表在互联网平台上,通常这些评论数据夹带着用户个人对某件事持有的观点或者情感倾向。人们希望对互联网平台上用户发表的评论数据,利用技术手段对其进行分析和挖掘,从而获得评论数据蕴含的价值。如电子商务中的商家希望从用户对特定商品的评价中获得该商品的市场价值,政府官员希望从社交媒体用户发表对特定事件的评论中获得当前的舆论影响。
方面级情感分析(Aspect-based sentiment analysis,简称ABSA)是情感分析任务中更加细粒度的子任务。相较于文档级情感分析和句子级情感分析,它在实际生活中有着更加广泛的价值。方面级情感分析与其它两种情感分析任务有着很大的区别,因为方面级情感分析是以情感目标作为基本的情感载体,这里的目标不像前面两种情感分析任务中的文档或者句子的规模,而是情感表达的对象,通常是一个实体或者实体的某个方面。比如在饭店的评论“饭菜的口味很好,但是服务却很糟糕”中,“口味”和“服务”是该条评论中所包含的两个情感表达的目标,也就是方面,“很好”和“糟糕”是对应于方面的情感极性。
综合来看,方面级情感分析具有粒度更细、决策更准等优势,随着大数据时代的到来,日益复杂的舆论环境、更加多元化的需求使得方面级的情感分析成为了研究重点。
方面级情感分析的方法主要有传统的方面级情感分析方法和基于深度学习的方面级情感分析方法。在传统的方面级情感分析方法中又主要分为基于规则的方法和基于统计的方法两种,基于规则的方法通常利用构建好的情感词典,对句子中的形容词通过词典获取到它的情感极性,然后利用方面和情感词之间的规则获得方面的情感极性。基于统计的方法将方面级情感分析任务看成一个情感分类任务,通常可以利用机器学习等方法进行求解,比如用LDA模型获得不同情感极性的主题,方面的情感极性根据主题的类别获得。除此之外,还可利用SVM、CRF或最大熵模型进行情感分类。基于规则的方法通常需要语言学家进行大量的形容词极性标注工作以及规则的制定工作,因此分类的准确性和标注的结果、规则的制定都有非常紧密的联系。虽然基于统计的方法不再需要语言学家提前制定大量的规则,它依赖相关的语料库实现方面级的特征提取,然而基于统计的方法需要对数据进行人工特征筛选,也就是基于统计的方法中核心的工作仍然需要人工完成。
随着深度学习技术的快速崛起和大规模的应用,深度神经网络在方面级情感分析领域的应用也在逐渐增多。不同与传统的机器学习方法,深度学习技术不需要人工对输入的数据进行特征工程,而是通过深度的神经网络自己来提取有用的特征。在方面级情感分析任务中,深度学习技术通常是对所给定的段落和方面类别分别进行编码,然后利用注意力机制将段落和方面类别进行融合,再利用解码层进行方面类别的情感极性的分类,预测器的输出如果与正确的情感极性不同,那么进行误差的反向传播,更新预测器权重,循环此过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110378141.7/2.html,转载请声明来源钻瓜专利网。