[发明专利]一种基于信息传播特点的虚假舆论识别系统及其处理方法有效
| 申请号: | 202011556337.2 | 申请日: | 2020-12-25 |
| 公开(公告)号: | CN112508726B | 公开(公告)日: | 2022-04-19 |
| 发明(设计)人: | 周铁华;王玲;姜波 | 申请(专利权)人: | 东北电力大学 |
| 主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06Q10/04;G06Q10/06;G06F16/906 |
| 代理公司: | 北京君泊知识产权代理有限公司 11496 | 代理人: | 王程远 |
| 地址: | 132013 吉林省吉*** | 国省代码: | 吉林;22 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 信息 传播 特点 虚假 舆论 识别 系统 及其 处理 方法 | ||
1.一种基于信息传播特点的虚假舆论识别系统,其特征在于,包括:
(1)数据采集和数据库管理模块:进行数据采集、数据分类和数据预处理,构建社交网络虚假舆论识别本体数据库,包括数据采集装置、数据分类装置、数据预处理装置:
1)所述数据分类装置对采集数据进行类别的划分,包括两类:
a、用户的属性数据:用户编号ID,用户的昵称n,用户的年龄y、用户的职业x、用户的喜好h;
b、用户的行为数据:用户的点赞量NL、转发量NF和评论数据NC;
2)所述数据预处理装置设置为:
a、构建虚假舆论字典L={TC,SW},其中TC是话题类别,SW是主题词,使用one-hot编码函数Vector将所述用户属性数据和行为数据向量化,用户属性向量UV=Vector(y/100(NC+n+x+h)),虚假舆论词典向量DV=Vector(TC+SW),定义pij表示用户i对用户j的影响力,采用公式
b、根据用户的行为数据,提取用户之间的互动关系,用于构建社交网络图模型;
(2)虚假舆论影响力传播计算模块:根据用户的行为数据结合信息传播特点构建虚假舆论影响力传播模型,包括图模型构建装置和虚假舆论影响力传播的计算装置:
1)所述图模型构建装置设置为:以预处理的数据为基础,分析数据中用户的互动关系,提取出社交网络图数据结构,将社交网络抽象为图模型,用户表示为图中的节点V={v1,v2,v3,...,vn},用户之间的联系表示为图中的边E={eij},并且(i,j)={1,2,3,...,n},P={Pij}表示边eij的权值,用户之间的互动关系用节点的出度D={dv1,dv2,dv3,...,dvn}表示,社交网络图模型G={v1:{v2:p12,v3:p13},v2:{v5:p25,v3:p23,v9:p29,…},…};
2)所述虚假舆论影响力传播计算装置为:
a、设定每个用户的激活阈值θv={I(v),Nin(v)},其中I(v)为节点v的入度,Nin(v)为节点v的入度节点集合,每个用户的激活阈值计算采用公式
b、设定每个用户的影响力传播激活转态P={v,u,puv},其中v表示待激活的用户节点,u表示已经激活且对用户v有影响力的用户,puv表示用户u影响到用户v的可能性,puv∈[0,1],社交网络中每一个用户被激活,即参与到某一热点事件讨论中的计算公式为
(3)用户分群模块:根据虚假舆论信息的传播特点,将社交网络中的用户分为不同的聚集性群体,挖掘出每个用户群体中的影响力最大个体,包括用户群体挖掘装置和群体内部影响力最大化用户挖掘装置:
1)所述用户群体挖掘装置设置为:用Rq表示用户群体,其中q={1,2,...,w},w表示用户群体数量,该装置内部通过图模型计算的用户群体指标公式为:其中vi满足vi∈V,并且r为参与话题讨论的最小用户数;
2)所述影响力最大化用户挖掘装置设置为:
a、读取用户分群数据,构建社交网络图模型;
b、设定用户影响力增益量化指标ΔG(vi)={S,vi},其中S为已知有较大影响力的种子用户,初始化为Φ节点集合,v为某一待计算影响力的用户节点,采用公式其中,为干扰因子,为消除在不同硬件环境下的计算误差,种子集影响力增益采用公式
c、设定用户影响力增益计算成本指标t是采集到的ΔG(vi)的计算成本,其中,β为干扰因子,为消除在不同硬件环境下的计算误差,种子集影响力计算成本采用公式
d、设定影响力最大用户挖掘条件B(S)={S,vi},其中S为已知有较大影响力的种子用户,初始化为Φ节点集合,vi为某一待计算影响力和时间成本的用户节点,采用公式
(4)虚假舆论识别模块:将虚假舆论信息传播规律和虚假舆论信息的特征进行综合分析和准确识别,包括虚假舆论预测装置:
所述虚假舆论预测装置设定虚假舆论拟合参数ρ={vt,St,v,S},其中vt是对于某一新的热点事件通过上述步骤计算的影响力最大个体,St是vt集合,需要保证St≥B(S),v表示系统已学习到的影响力最大个体,S是v的集合,需要保证S≥B(S);len(St)表示集合St元素数量,采用公式当ρ≥0.5时,认为该热点事件是虚假舆论,该阈值依据实际情况自行调整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北电力大学,未经东北电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011556337.2/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





