[发明专利]一种融合复杂关系的虚假评论者群体检测方法在审
申请号: | 202210449853.8 | 申请日: | 2022-04-27 |
公开(公告)号: | CN114742564A | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 于硕;李世豪;雷启航;夏锋 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06K9/62 |
代理公司: | 辽宁鸿文知识产权代理有限公司 21102 | 代理人: | 许明章;王海波 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 复杂 关系 虚假 评论 群体 检测 方法 | ||
1.一种融合复杂关系的虚假评论者群体检测方法,其特征在于,该融合复杂关系的虚假评论者群体检测方法使用基于注意力机制的图神经网络对评论网络中的评论节点进行表征更新;设计图重构损失和自监督分布损失进行模型训练,获得最优模型后应用于虚假评论者群体检测识别出评论网络中的虚假评论者群体;包括具体步骤如下:
第一步,更新节点表征,获得重构图;基于注意力机制的图神经网络作为编码器;以节点的初始特征作为节点初始嵌入,在基于注意力机制的图神经网络上融入节点复杂关系,使得节点表征同时表达高阶结构特征与属性特征;
1.1)计算节点相似性;将节点限制于中心节点的一阶邻居节点内,计算公式如下:
cij=a(Whi,Whj)#(1)
式中,cij代表了节点j对于节点i的重要性,W代表权重矩阵;hi与hj分别代表节点i与节点j的特征向量;a代表计算节点相似性的函数;
1.2)计算复杂关系矩阵;通过考虑节点的高阶邻居节点,获得节点的复杂关系矩阵:
M=(B+B2+…+Bt)/t# (2)
式中,B为转换矩阵,当节点i和节点j之间存在边,Bij=1/di,其中di为节点的度;当节点i和节点j之间不存在边,Bij=0;矩阵M代表复杂关系矩阵,Mij为节点i和节点j在t阶下的复杂关系;
1.3)融合复杂关系;以单层前馈神经网络为计算方式,将复杂关系矩阵M与基于注意力机制的图神经网络融合,具体为将复杂关系矩阵与节点相似性相乘;选择LeakyReLU作为激活函数,融合复杂关系,节点j对节点i的重要性表达式被重写为:
1.4)更新节点表征;softmax函数对邻居节点的重要性做归一化处理,使一阶邻居节点对中心节点的重要性分布在[0,1]之间,聚合邻居节点的特征以更新节点表征;
式(4)中,αij代表归一化后的注意力系数;Ni代表节点i的一阶邻居集合;
式(5)中,为节点i的相邻节点j在第l层上的表示,代表节点i在第l+1上的表示;节点最终表征经多层聚合获得;
第二步,模型训练;设计图重构损失函数与自监督分布损失函数,更新基于注意力机制的图神经网络模型参数完成训练,具体步骤为:
2.1)计算图重构损失函数;根据编码器重构图的拓扑信息,计算邻接矩阵间差异获取重构图与原图的重构损失;公式为:
式中,为邻接矩阵;H为更新后的节点表征矩阵;σ为激活函数;
2.2)计算自监督分布损失函数;采用自监督的训练方式,采用伪标记优化节点嵌入表示;采用聚类算法对节点进行聚类,并采用DBSCAN聚类算法确定评论网络中的核心点,计算各节点与核心点之间的距离分布;使用KL散度作为损失函数,以衡量节点与核心点之间的距离分布与其伪标记的差异;
2.3)计算联合损失函数;联合损失函数表达式为:
L=·Lr+βLc# (7)
式中,Lr为图重构损失函数,Lc为自监督分布损失函数,β两损失函数之间的权重;
2.4)模型训练,设定基于注意力机制的图神经网络模型的初始参数,基于联合损失函数,迭代训练过程,获得基于注意力机制的图神经网络模型的最佳参数;
第三步,虚假评论群体检测;采用第二步获取的基于注意力机制的图神经网络模型,对真实评论网络进行检测,并保存检测结果。
2.根据权利要求1所述的融合复杂关系的虚假评论者群体检测方法,其特征在于,所述的图重构损失函数采用交叉熵损失函数;所述对节点进行聚类的聚类算法采用KMeans聚类算法。
3.根据权利要求2所述的融合复杂关系的虚假评论者群体检测方法,其特征在于,所述2.4)中模型训练的具体做法如下:
设定基于注意力机制的图神经网络模型的初始参数,包括基于注意力机制的图神经网络模型的聚合层数、节点嵌入维度、KMeans聚类算法的聚类个数和训练迭代次数;
模型训练过程中,不断调整参数,根据训练过程中联合损失函数的下降情况或模型的最终检测结果确定最优参数;
具体为:将评论网络以及网络的邻接矩阵输入至模型,运行并训练模型,记录本次训练后模型的检测表现,在同一组超参数下多次重复训练,取检测精度的平均值作为最终的结果检测精度;完成一组参数下的模型训练后,遵循控制变量法对模型中的参数进行调整,按照使得平均精度增大的方向调整模型某一参数,保持其它参数不变;重复调整参数,保留使模型平均判别精度达到最高的一组参数设置,模型训练完毕。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210449853.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种激光芯片测试分选机及其工作方法
- 下一篇:一种沙化土地综合治理方法