[发明专利]一种社交网络中的不良实体传播抑制方法在审
申请号: | 202211041720.3 | 申请日: | 2022-08-29 |
公开(公告)号: | CN115426153A | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 毛勇超;周波;宣琦;吕宇乾 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;H04L41/12;H04L41/14;H04L41/147;H04L51/52 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 舒良 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 社交 网络 中的 不良 实体 传播 抑制 方法 | ||
1.一种社交网络中的不良实体传播抑制方法,其特征在于:包括以下步骤:
S1:假设存在一个无向无权网络G,基于SIR模型的游走策略,假设以网络G中某个节点为不良实体传播的起始点,在图中进行游走采样,记录该起始点的不良实体传播路径,构建语料库,同时记录被该起始点传染的节点ID列表,重复以上操作直至遍历所有节点;
S2:将步骤S1所述语料库置于word2vec模型中训练,使用训练完成的模型,构建节点特征矩阵,计算节点相似性矩阵,获得网络G中各个连边的节点对相似度sim1;
S3:根据步骤S1所述网络G中以不同节点为起始点的被传染节点ID列表,计算网络G中各个连边的节点对之间存在相同的被传染节点ID的数量,归一化计算网络G中各个连边的节点对相似度sim2;
S4:将sim1和sim2的加权平均数作为网络G中连边的权值,排序连边权值,删除top-k的连边能有效抑制不良实体的传播。
2.如权利要求1所述的一种社交网络中的不良实体传播抑制方法,其特征在于:所述步骤S1包括:
假设存在无向无权社交网络G=(V,E),V是网络中节点的集合,E是网络中连边的集合,构建SIR模型,设置时间窗口为days=100,设置感染率β=0.1,设置恢复率γ=0.05,以网络中的某个节点为初始感染者,其余节点为易感者,记录该节点感染传播的路径,构建语料库,同时记录被该起始点传染的节点ID列表,重复以上操作直至遍历网络G中的所有节点。
3.如权利要求1所述的一种社交网络中的不良实体传播抑制方法,其特征在于:所述步骤S2包括:
将所有所述传播路径组成列表格式,作为语料库输入word2vec模型中,设置vector_size=64,即节点嵌入的维度为64,构建词汇表并且训练,保存训练完成的模型,构建节点特征矩阵,其维度应为|V|×64,计算节点之间的余弦相似度,如下式(1):
其中X,Y分别为64维的节点特征向量,构建以余弦相似度为矩阵元素的对称矩阵|V|×|V|,可以根据网络G中的连边[a,b]检索位于相似矩阵中第a行、第b列对应的值为sim1a,b,即为连边[a,b]的一个相似度。
4.如权利要求1所述的一种社交网络中的不良实体传播抑制方法,其特征在于:所述步骤S3包括:
根据步骤S1所述网络G中以不同节点为起始点的被传染节点ID列表,计算网络G各个连边的节点对之间存在相同被感染节点ID的数量,记为num,构建节点对和相同节点ID数量的嵌套列表,例如[[a,b,numa,b],...],其中a,b为节点,numa,b代表节点对[a,b]之间相同被感染节点ID数量,归一化计算网络G中各个连边的节点对[a,b]相似度sim2a,b,如下式(2):
其中,numa,b表示节点对[a,b]之间存在相同被感染节点ID的数量,nummax和nummin表示所有节点对中相同被感染节点数量的最大值和最小值。
5.如权利要求1所述的一种社交网络中的不良实体传播抑制方法,其特征在于:所述步骤S4包括:
将sim1a,b和sim2a,b的加权平均数作为网络G中连边的权值,如下式(3):
sima,b=0.5×sim1a,b+0.5×sim2a,b (3)
将sima,b作为连边的权值写入网络G的边列表,根据权值从大到小对所有连边进行排序,删除其中top-k的连边可以有效抑制不良实体的传播。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211041720.3/1.html,转载请声明来源钻瓜专利网。