[发明专利]基于图注意力网络的案件微博属性级观点挖掘方法在审
| 申请号: | 202210511507.8 | 申请日: | 2022-05-12 |
| 公开(公告)号: | CN114943216A | 公开(公告)日: | 2022-08-26 |
| 发明(设计)人: | 余正涛;王静赟;相艳 | 申请(专利权)人: | 昆明理工大学 |
| 主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/253;G06F40/284;G06F40/30;G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 昆明隆合知识产权代理事务所(普通合伙) 53220 | 代理人: | 何娇 |
| 地址: | 650500 云南*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 注意力 网络 案件 属性 观点 挖掘 方法 | ||
本发明涉及基于图注意力网络的案件微博属性级观点挖掘方法,属于自然语言处理技术领域。本发明首先使用斯坦福工具得到涉案微博评论句的句法依存关系;然后,重塑评论句的句法依存关系,只保留属性词与观点词之间的主要句法信息,丢弃次要句法信息;最后,使用关系图注意力网络模型进行编码,对属性词对应的观点词和情感倾向性进行联合抽取。本发明解决了现有方法不能有效的对案件微博评论的属性词和观点词的关系进行建模,从而利用抽取的观点词预测情感极性的问题。
技术领域
本发明涉及基于图注意力网络的案件微博属性级观点挖掘方法,属于自然语言处理技术领域。
背景技术
微博等社交媒体的蓬勃发展让人们获得更丰富、更及时的信息,同时每天也会产生大量评论。其中,与案件相关的评论在网络上迅速传播,所产生的舆论会干扰有关机构的工作。为此,获取案件微博评论属性词对应的观点词并判断其情感倾向性,有助于司法机关掌握大众的舆论走势,降低舆情事件带来的风险。案件微博观点挖掘主要包括观点词抽取和属性级情感分类,其目的是针对从微博用户评论文本中识别出的属性词,提取其对应的观点词并判断网友的情感倾向性。在这一任务中,本发明将情感倾向性分为三类:积极、消极、中性。由于涉案微博评论的属性词和观点词之间存在一定的句法关系,同时,观点词抽取和属性词情感分析是两个相互促进的任务。但是现有方法存在对属性词和观点词之间的关系利用不足的问题,因此,该任务的难点在于如何对属性词和观点词的关系进行建模,从而利用抽取的观点词预测情感极性。例如在“这个品牌也太嚣张了,大家一定要持续关注啊”这句评论中,出现了“了、啊”等这样的语气词,这些词包含的句法信息往往是无关紧要的,有时甚至会对模型造成负面影响。显然,这些次要的句法信息是需要被丢弃的。因此,可以对涉案微博评论的句法关系进行重塑,即只保留属性词与观点词之间的主要句法信息,丢弃次要句法信息。同时,直观来看,网友的情感倾向性往往是由观点词决定的,观点词抽取和属性级情感分类是两个相互促进的子任务,将它们的损失函数进行联合学习,可以进一步提升观点词抽取和属性级情感分类的性能。
发明内容
本发明提供了基于图注意力网络的案件微博属性级观点挖掘方法,以用于解决现有方法不能有效的对案件微博评论的属性词和观点词的关系进行建模,从而利用抽取的观点词预测情感极性等问题,本发明提升观点挖掘的精度。
本发明的技术方案是:基于图注意力网络的案件微博属性级观点挖掘方法,所述基于图注意力网络的案件微博属性级观点挖掘方法的具体步骤如下:
Step1、收集用于案件微博属性级观点挖掘的微博评论文本,对微博评论文本进行去重与筛选;
作为本发明的优选方案,所述Step1中,使用Scrapy作为爬取工具,收集用于案件微博属性级观点挖掘的微博评论文本,然后对其进行去重和筛选。
此优选方案设计是本发明的重要组成部分,主要为本发明收集语料过程,为本发明抽取涉案微博评价对象提供了数据支撑。
Step2、对涉案微博评论文本进行分词等预处理,定制案件微博属性级观点挖掘的标注体系,标记微博评价文本,将标记好的微博评论语料按照8:1:1的比例分配训练语料、验证语料和测试语料;
Step3、获取评论语句对应的词向量,训练数据经过预处理后输入斯坦福工具,得到评论的句法依存关系;
Step4、对评论的句法依存关系进行重塑,只保留属性词与观点词之间的直接句法关系,丢弃属性词与观点词之间的间接句法关系;
Step5、使用关系图注意力网络模型进行编码,对属性词对应的观点词和情感倾向性进行联合抽取。
作为本发明的优选方案,所述步骤Step2的具体步骤为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210511507.8/2.html,转载请声明来源钻瓜专利网。





