[发明专利]一种带有差分隐私机制的三维时空信息传播预测方法有效
申请号: | 201910893891.0 | 申请日: | 2019-09-20 |
公开(公告)号: | CN110633402B | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 多允慧;孙福权;姜玉山;刘晏君 | 申请(专利权)人: | 东北大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06Q10/04;G06Q50/00 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 陈玲玉;梅洪玉 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 带有 隐私 机制 三维 时空 信息 传播 预测 方法 | ||
1.一种带有差分隐私机制的三维时空信息传播预测方法,其特征在于,包括以下步骤:
步骤1:获取信息数据与预处理
获取信息数据,包括信息数据和与信息数据对应的用户数据;其中用户数据包括多个用户属性特征,包括用户信息、用户社交关系、用户地理信息;
将获取的信息数据中噪音数据去除,并对其按照时间区间进行划分;在单位时间中,从获取的数据中找出对热点话题做出反应的用户,并依此建立相应的网络拓扑结构,并存入数据库;
步骤2:提取用户属性
基于步骤1对获取的信息数据,分别从社会属性和地理属性两方面提取用户属性;
步骤2.1:采用网络距离表示用户社会属性
用p表示信息从信息源点用户向信息接收用户传递所需的最少用户跳次数;将用户获取信息的途径数定义为入度数,用q表示;考虑到用户的入度对一个用户接收到信息的影响,设信息接收用户i离信息源点用户的网络距离为xi,其上一层用户集合为{ui1,ui2,...,uiq},对应的网络距离分别为{xi1,xi2,...,xiq},提取的网络度量表达式为:
步骤2.2:采用地理距离表示用户地理属性
针对步骤1提取的用户地理信息,通过地理距离来表示用户的地理属性:
其中,R表示地球半径,lati和latj表示在弧度系统中用户i和j的经度,longi和longj表示在弧度系统中用户i和j的纬度,oij表示两个用户的伪地理距离;
将伪地理距离oij离散化得到地理距离yi,如下所示:
其中,[oi/1000]表示为取整数的函数;oi表示每个信息接收用户i与信息源用户的伪地理距离;
步骤3:通过构建具有差分隐私的信息扩散系数函数建立差分隐私保护机制
步骤3.1:信息传播预测模型中包含两个信息扩散系数函数,用d1和d2表示;d1代表信息沿着网络链路传播的能力,d1随网络距离x呈指数衰减;d2代表信息沿着地理距离传播的能力,d2随网络距离y呈指数衰减;由下式表示:
其中,b代表在社交网络中关于友谊结构的信息受欢迎程度的下降程度;
步骤3.2:基于步骤3.1给定的d1和d2,运用差分隐私保护机制验证信息扩散系数函数d1和d2是满足ε-差分隐私的,并给出以下定义:
所述的信息扩散系数函数d1的隐私保护机制对每个信息扩散的输出S和社会距离的集合x,给定ε-差分隐私,其中ε>0;如果两个数据集D和D′都具有相同的信息源,但是其社会距离x不一样;DΔD′表示两个数据集之间的差异,其中|DΔD′|代表着在DΔD′集合中社会距离的个数;Pr表示隐私泄露的概率,对所有数据集
Pr[d′1(hop2)∈S]≤eε×Pr[d1(hop1)∈S] (5)
因此,所述的信息扩散系数函数d1是满足ε-差分隐私的;
所述的信息扩散系数函数d2的隐私保护机制对每个信息扩散的输出S和地理距离的集合y,给定了ε-差分隐私,其中ε>0;如果两个数据集D和D′都具有相同的信息源,但是其地理距离不一样;DΔD′表示两个数据集之间的差异,其中|DΔD′|代表着在DΔD′集合中地理距离个数;Pr表示隐私泄露的概率,对所有数据集
Pr[d′2(hop2)∈S]≤eε×Pr[d2(hop1)∈S] (6)
因此,所述的信息扩散系数函数d2是满足ε-差分隐私的;
步骤4:构建信息传播预测模型
步骤4.1:通过社会过程和生长过程构建具有差分隐私机制的信息传播预测模型
步骤4.1.1:构建社会过程
U表示社会信息网络中的用户总数,s表示信息源;根据空间距离的定义,可将所有用户按照他们到信息源的距离进行分类,将U分组表示,即,U={U1y,U2y,…,Uxy,Uiy},Uxy(t)表示在t时到信息源在网络距离为x、地理距离为y的所有用户组成的集合;随着信息在社会信息网络的传播,一些用户通过上传、评论、点赞、转发或其他活动,表达他们对信息的兴趣,将上述用户称为该信息的受影响用户;用I(x,y,t)表示在t时刻、(x,y)处受影响用户的密度,则:
在无向图G=(V,E)中:G表示社交网络图;V表示节点集V={vi|i=1,2,…};E表示边缘集E:E={(vi,vj)|i,j=1,2,…,i≠j};
则有社会过程式:
步骤4.1.2:构建生长过程
生长过程作为一种同等距离内的信息传播过程,使用Logistic模型来表示;其生长过程式如下:
其中:h表示具有相同空间距离的受影响用户的内在增长率,衡量信息在用户内部传播的快慢;N表示承载能力,为受影响用户的最大可能密度;
步骤4.1.3:结合步骤4.1.1和步骤4.1.2得到的社会过程式和生长过程式,构建带有差分隐私机制的信息传播预测模型,得如下所示:
其中,信息扩散系数函数d1和d2表示信息在社会位置和地理位置上的信息传播能力,分别是网络距离x和地理距离y的指数衰减函数;在区域Ω=[0,X]×[0,Y]的边界上,x,y和t的取值范围分别取为0≤x≤X,0≤y≤Y和0≤t≤T,其中X,Y,T分别表示x,y,t取值的临界值,且X,Y,T>0;根据Dirchlet的边界条件,边界上不存在受影响的用户,即在边界上的信息传播热度为0;因此,上述信息传播预测模型的边界条件为:
在初始时刻t=0时,初始条件选取二维脉冲函数,即其中要满足以下条件:
步骤4.2:对步骤4.1得到的带有差分隐私机制的信息传播预测模型进行改进,构建带有差分隐私机制的三维时空信息传播预测模型;
基于步骤4.1.3提出的信息传播预测模型可以形式化地表示在极坐标下带有差分隐私机制的三维时空信息传播预测模型,如下:
其中,μ为与r,θ无关的常数;
通过改变用户的位置,得到x和y的多种组合,并能够得到丰富三维曲线图;上述三维时空信息传播预测模型用于预测任意用户在r≤R下的任意信息扩散曲线图。
2.根据权利要求要求1所述的一种带有差分隐私机制的三维时空信息传播预测方法,其特征在于,所述的步骤1中通过以下两种方法之一获取信息数据:
a:从现有的在线社交媒体的公共API下获取用户相关信息;
b:通过网络爬虫技术抓取web中的内容以获取社交网络用户的相关信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910893891.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种门店数据的预测模型及其建立方法
- 下一篇:一种行程匹配方法及系统