[发明专利]基于图注意力网络的案件微博属性级观点挖掘方法在审
| 申请号: | 202210511507.8 | 申请日: | 2022-05-12 |
| 公开(公告)号: | CN114943216A | 公开(公告)日: | 2022-08-26 |
| 发明(设计)人: | 余正涛;王静赟;相艳 | 申请(专利权)人: | 昆明理工大学 |
| 主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/253;G06F40/284;G06F40/30;G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 昆明隆合知识产权代理事务所(普通合伙) 53220 | 代理人: | 何娇 |
| 地址: | 650500 云南*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 注意力 网络 案件 属性 观点 挖掘 方法 | ||
1.基于图注意力网络的案件微博属性级观点挖掘方法,其特征在于:所述基于图注意力网络的案件微博属性级观点挖掘方法的具体步骤如下:
Step1、收集用于案件微博属性级观点挖掘的微博评论文本,对微博评论文本进行去重与筛选;
Step2、定制案件微博属性级观点挖掘的标注体系,标记微博评论文本,将标记好的微博评论语料分为训练语料、验证语料和测试语料;
Step3、获取评论语句对应的词向量,训练数据经过预处理后输入斯坦福工具,得到评论的句法依存关系;
Step4、对评论的句法依存关系进行重塑,只保留属性词与观点词之间的直接句法关系,丢弃属性词与观点词之间的间接句法关系;
Step5、使用关系图注意力网络模型进行编码,对属性词对应的观点词和情感倾向性进行联合抽取。
2.根据权利要求1所述的基于图注意力网络的案件微博属性级观点挖掘方法,其特征在于:所述步骤Step1的具体步骤为:
Step1.1、使用Scrapy作为爬取工具,收集用于案件微博属性级观点挖掘的微博评论文本;
Step1.2、对收集到的微博评论文本进行去重与筛选。
3.根据权利要求1所述的基于图注意力网络的案件微博属性级观点挖掘方法,其特征在于:所述步骤Step2的具体步骤为:
Step2.1、定制的案件微博属性级观点挖掘的标注体系采用了XML的可扩展标记语言组织文本,分别针对属性词文本、属性词的开始位置、属性词的结束位置、观点词文本、观点词的开始位置、观点词的结束位置及属性词的情感极性对收集到的微博评论文本进行标记;
Step2.2、再将实验数据分为训练语料、验证语料和测试语料。
4.根据权利要求1所述的基于图注意力网络的案件微博属性级观点挖掘方法,其特征在于:所述步骤Step3的具体步骤为:将评论句输入斯坦福工具,得到评论句的句法依存树T。
5.根据权利要求1所述的基于图注意力网络的案件微博属性级观点挖掘方法,其特征在于:所述步骤Step4的具体步骤:
Step4.1、将属性词放在依存树的根部;
Step4.2、对于依存树中节点与节点之间的依存关系,只保留属性词与观点词之间的直接句法关系,丢弃属性词与观点词之间的间接句法关系;
Step4.3、如果一个评论句子包含多个属性词,将把句中每个属性词分别作为根,构造一棵唯一的树,减少无关节点和关系的影响。
6.根据权利要求1所述的基于图注意力网络的案件微博属性级观点挖掘方法,其特征在于:所述步骤Step5的具体步骤为:
Step5.1、将依存关系分别映射到两个向量空间:E[rij]和U[rij];其中,E[rij]用于预测属性词的情感倾向性,U[rij]用于抽取观点词;
Step5.2、分别利用关系图注意力网络对隐状态节点进行更新,以此对属性词情感极性和观点词进行联合抽取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210511507.8/1.html,转载请声明来源钻瓜专利网。





