[发明专利]一种评论情感原因三元组抽取方法在审
申请号: | 202110973766.8 | 申请日: | 2021-08-24 |
公开(公告)号: | CN113779245A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 宋大为;宋昊霖;华玲誉 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06F40/30;G06N3/04;G06Q30/02;G06Q50/00 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 张利萍 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 评论 情感 原因 三元 抽取 方法 | ||
本发明涉及一种评论情感原因三元组抽取方法,属于自然语言处理中的情感分析及信息抽取技术领域。本方法综合了情感原因抽取技术、情感分析技术和信息抽取技术,同时抽取出情感句、原因句以及情感类型三元组,即情感原因三元组,并将其应用于评论场景。本方法克服了情感原因抽取结果实用性较低、应用场景受限的缺点,解决了现有情感原因抽取方法存在的错误传播、使用复杂、耗时等缺点,实现了情感原因三元组端到端的抽取。本方法改进了现有评论方式分类粒度较粗、信息过多等问题,可以很好的提高用户的使用体验。
技术领域
本发明涉及一种评论情感原因三元组抽取方法,属于自然语言处理中的情感分析及信息抽取技术领域。
背景技术
情感分析的发展和快速起步,得益于网络上的社交媒体,例如产品评论、论坛讨论、微博、微信的快速发展,是人类历史上第一次有如此巨大数字量的形式记录。目前,情感分析已经成长为自然语言处理(NLP)中最活跃的研究领域之一,在数据挖掘、Web挖掘、文本挖掘和信息检索方面有广泛的研究。
传统的情感分析技术,仅能得到文本的情感极性(正向、中性、负向)。但是,更多深层次信息(例如引起情感的原因、表达情感的对象等)仍值得进一步挖掘。
情感原因对的抽取,旨在同时抽取出文本中的情感和引起情感的原因,从而获得更加丰富的和更深层次的信息。例如,“这台笔记本电脑真不好用,风扇特别吵,千万不要购买”,其中,“这台笔记本电脑真不好用”是情感句,而“风扇特别吵”则是与前述情感句所对应的原因句。这两个句子能够组成一个情感原因对。情感原因对的抽取结果,在舆情分析、文本分类、推荐系统等任务中,都有着很好的辅助作用。
目前,情感原因对的抽取,更多专注于情感句和原因句的抽取,且大多采用分开两步的抽取方法。第一步:从文档中抽取出情感句集合和原因句,并对这两个集合做笛卡尔积,转换为一个情感原因对集合。第二步:对情感原因对集合进行分类,判断情感句是否由对应原因句引起。
但是,现有的情感原因对抽取任务忽略了“情感类型”这一特征,导致抽取出的情感原因对不能被很好的利用,这大大限制了情感原因对在实际中的应用。例如,对于大量文本来说,单纯的抽取出情感句和原因句,如想要基于情感原因对进行决策制定(改进商品某点、保持某点,或者以某点为宣传点)或者文本分类则无法做到。但是,同时抽取出情感类型,如“这台笔记本电脑真不好用,风扇特别吵,千万不要购买”中,情感原因对的情感类型为:愤怒,则可以帮助商家了解产品需要改进的方面:风扇。
同时,采用两步的方法还存在着步与步之间的错误传播、使用复杂(需要保存中间结果)、耗时等多种缺点。
此外,目前的评论分类方式大多基于评分、好评差评、关键词抽取等粗粒度的方式,且只能简单的展示用户的完整评价全文。基于评分、好评差评的分类方式更多依靠用户所打分数,但在评论中有可能同时存在好的描述和坏的描述,而分数只是一个总体的指标。基于关键词抽取的分类方式,往往需要多个评论文本中有相同的短语,但每个人用词不同,同一个语义可以有不同的表达方式,这导致关键词抽取的质量不高、数量不多。而更加细粒度的分类以及更加浓缩的高质量的信息往往需要展示给用户。
发明内容
本发明的目的是为了克服现有技术在解决情感原因对抽取时存在的缺陷,为提高情感原因的利用率和应用效果,提出了一种端到端的评论情感原因三元组抽取方法。
本方法的创新点在于:综合了情感原因抽取技术、情感分析技术和信息抽取技术,同时抽取出情感句、原因句以及情感类型三元组,即情感原因三元组,并展示了其在评论场景下的具体应用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110973766.8/2.html,转载请声明来源钻瓜专利网。