[发明专利]一种融合复杂关系的虚假评论者群体检测方法在审

申请号：	202210449853.8	申请日：	2022-04-27
公开（公告）号：	CN114742564A	公开（公告）日：	2022-07-12
发明（设计）人：	于硕;李世豪;雷启航;夏锋	申请（专利权）人：	大连理工大学
主分类号：	G06Q30/00	分类号：	G06Q30/00;G06K9/62
代理公司：	辽宁鸿文知识产权代理有限公司 21102	代理人：	许明章;王海波
地址：	116024 辽***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种融合复杂关系虚假评论群体检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种融合复杂关系的虚假评论者群体检测方法，其特征在于，该融合复杂关系的虚假评论者群体检测方法使用基于注意力机制的图神经网络对评论网络中的评论节点进行表征更新；设计图重构损失和自监督分布损失进行模型训练，获得最优模型后应用于虚假评论者群体检测识别出评论网络中的虚假评论者群体；包括具体步骤如下：

第一步，更新节点表征，获得重构图；基于注意力机制的图神经网络作为编码器；以节点的初始特征作为节点初始嵌入，在基于注意力机制的图神经网络上融入节点复杂关系，使得节点表征同时表达高阶结构特征与属性特征；

1.1)计算节点相似性；将节点限制于中心节点的一阶邻居节点内，计算公式如下：

c_ij＝a(Wh_i，Wh_j)#(1)

式中，c_ij代表了节点j对于节点i的重要性，W代表权重矩阵；h_i与h_j分别代表节点i与节点j的特征向量；a代表计算节点相似性的函数；

1.2)计算复杂关系矩阵；通过考虑节点的高阶邻居节点，获得节点的复杂关系矩阵：

M＝(B+B²+…+B^t)/t# (2)

式中，B为转换矩阵，当节点i和节点j之间存在边，B_ij＝1/d_i，其中d_i为节点的度；当节点i和节点j之间不存在边，B_ij＝0；矩阵M代表复杂关系矩阵，M_ij为节点i和节点j在t阶下的复杂关系；

1.3)融合复杂关系；以单层前馈神经网络为计算方式，将复杂关系矩阵M与基于注意力机制的图神经网络融合，具体为将复杂关系矩阵与节点相似性相乘；选择LeakyReLU作为激活函数，融合复杂关系，节点j对节点i的重要性表达式被重写为：

1.4)更新节点表征；softmax函数对邻居节点的重要性做归一化处理，使一阶邻居节点对中心节点的重要性分布在[0，1]之间，聚合邻居节点的特征以更新节点表征；

式(4)中，α_ij代表归一化后的注意力系数；N_i代表节点i的一阶邻居集合；

式(5)中，为节点i的相邻节点j在第l层上的表示，代表节点i在第l+1上的表示；节点最终表征经多层聚合获得；

第二步，模型训练；设计图重构损失函数与自监督分布损失函数，更新基于注意力机制的图神经网络模型参数完成训练，具体步骤为：

2.1)计算图重构损失函数；根据编码器重构图的拓扑信息，计算邻接矩阵间差异获取重构图与原图的重构损失；公式为：

式中，为邻接矩阵；H为更新后的节点表征矩阵；σ为激活函数；

2.2)计算自监督分布损失函数；采用自监督的训练方式，采用伪标记优化节点嵌入表示；采用聚类算法对节点进行聚类，并采用DBSCAN聚类算法确定评论网络中的核心点，计算各节点与核心点之间的距离分布；使用KL散度作为损失函数，以衡量节点与核心点之间的距离分布与其伪标记的差异；

2.3)计算联合损失函数；联合损失函数表达式为：

L＝·L_r+βL_c# (7)

式中，L_r为图重构损失函数，L_c为自监督分布损失函数，β两损失函数之间的权重；

2.4)模型训练，设定基于注意力机制的图神经网络模型的初始参数，基于联合损失函数，迭代训练过程，获得基于注意力机制的图神经网络模型的最佳参数；

第三步，虚假评论群体检测；采用第二步获取的基于注意力机制的图神经网络模型，对真实评论网络进行检测，并保存检测结果。

2.根据权利要求1所述的融合复杂关系的虚假评论者群体检测方法，其特征在于，所述的图重构损失函数采用交叉熵损失函数；所述对节点进行聚类的聚类算法采用KMeans聚类算法。

3.根据权利要求2所述的融合复杂关系的虚假评论者群体检测方法，其特征在于，所述2.4)中模型训练的具体做法如下：

设定基于注意力机制的图神经网络模型的初始参数，包括基于注意力机制的图神经网络模型的聚合层数、节点嵌入维度、KMeans聚类算法的聚类个数和训练迭代次数；

模型训练过程中，不断调整参数，根据训练过程中联合损失函数的下降情况或模型的最终检测结果确定最优参数；

具体为：将评论网络以及网络的邻接矩阵输入至模型，运行并训练模型，记录本次训练后模型的检测表现，在同一组超参数下多次重复训练，取检测精度的平均值作为最终的结果检测精度；完成一组参数下的模型训练后，遵循控制变量法对模型中的参数进行调整，按照使得平均精度增大的方向调整模型某一参数，保持其它参数不变；重复调整参数，保留使模型平均判别精度达到最高的一组参数设置，模型训练完毕。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于大连理工大学，未经大连理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210449853.8/1.html，转载请声明来源钻瓜专利网。

上一篇：一种激光芯片测试分选机及其工作方法
下一篇：一种沙化土地综合治理方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q30-00 商业，例如购物或电子商务
G06Q30-02 .行销，例如，市场研究与分析、调查、促销、广告、买方剖析研究、客户管理或奖励；价格评估或确定
G06Q30-04 .签单或开发票
G06Q30-06 .购买、出售或租赁交易
G06Q30-08 ..拍卖

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种融合复杂关系的虚假评论者群体检测方法在审

专利文献下载