[发明专利]一种基于混合节点图的涉案微博对象级情感分类方法有效
申请号: | 202110447826.2 | 申请日: | 2021-04-25 |
公开(公告)号: | CN113076490B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 相艳;谭晓聪;王红斌;余正涛;郭军军 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/35;G06F40/30;G06N3/0442;G06N3/0464 |
代理公司: | 昆明人从众知识产权代理有限公司 53204 | 代理人: | 何娇 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 混合 节点 涉案 对象 情感 分类 方法 | ||
1.一种基于混合节点图的涉案微博对象级情感分类方法,其特征在于:所述方法将评论及其评价对象类别视为一个混合节点,根据混合节点之间的语义相似性和情感关联性分别构建语义图和情感图;然后,将语义图和情感图堆叠为一个图张量,并对图张量的每一层执行图内卷积和图间卷积两种卷积操作;最后,在标签的监督下,基于混合节点的特征完成情感分类;
所述方法具体包括如下步骤:
Step1、收集文本;
Step2、文本处理;
Step3、混合节点特征的初始化;
Step4、构建情感图与语义图;
Step5、构建图张量和特征学习;
Step6、将混合节点的特征向量送入softmax分类器,得到该混合节点属于不同情感类别的概率;
所述Step4中包括:
如果两个评论既针对同一类评价对象展开讨论,又含有同样的情感词,则认为二者具有情感关联,即可构建基于情感图;
如果两个混合节点的Bert向量具有相似度,则它们应该是相邻节点,并且应该交换它们的信息,即可构建语义图;
所述Step4中,情感图的邻接矩阵中两个混合节点vi与vj之间边的权重计算如下所示:
其中#{.}表示满足条件的词的总数,wk是情感词典中的第k个词,Xi和Xj表示数据集中的第i和第j个评论;
如果两个混合节点的语义具有相似度,则构建语义图,通过以下公式得到两个混合节点之间的边权重和语义图的邻接矩阵中的边权重;
其中,hi是混合节点vi的初始特征,hj是混合节点vj的初始特征,||·||表示向量的大小,α是度量相似性的阈值。
2.根据权利要求l所述的基于混合节点图的涉案微博对象级情感分类方法,其特征在于:所述文本处理包括分词、去除停用词、词频统计、文档频率统计。
3.根据权利要求1所述的基于混合节点图的涉案微博对象级情感分类方法,其特征在于:所述Step3中,混合节点特征的初始化如下:
用主题模型对整个数据集进行建模,得到不同评价对象类别的代表性词项及每个评论对应的评价对象类别概率分布;
其中,对于有标签评论,根据其标签类别确定其对应的代表性词项;
对于无标签评论,根据其概率分布的最大值确定其类别标签,进一步确定其对应的代表性词项;
通过上述方法得到每个评论的类别及其代表性词项;然后使用Google发布的中文预训练BERT模型对混合节点进行BERT向量编码,获得混合节点的语义表征。
4.根据权利要求l所述的基于混合节点图的涉案微博对象级情感分类方法,其特征在于:所述Step5中,利用情感图和语义图构造图张量,一个图张量表示为其中Gi=(Vi,Ei,Ai)是第i个单独的图;t=2;在不同的图中,节点相同而节点间的边不同,即Vi=Vj,Ai≠Aj,i,j=1,2,…,t,且i≠j;将不同的邻接矩阵堆叠为一个张量;将称为一个图邻接张量,其中Ai(i=1,2,…,t)是图张量中第i个图的邻接矩阵;同样,将不同的特征矩阵堆叠为一个特征张量其中是图张量中第i个图的特征矩阵;所构建的图张量中,图节点在特征学习时,除了同一张图中不同节点进行信息传递,不同图的同一节点间的信息也进行异构信息的传递,故对于图张量的每一层,执行同一张图的图内卷积、不同图的图间卷积。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110447826.2/1.html,转载请声明来源钻瓜专利网。