[发明专利]基于差分隐私的时空泛化轨迹数据发布方法在审
| 申请号: | 202210256578.8 | 申请日: | 2022-03-16 |
| 公开(公告)号: | CN114462093A | 公开(公告)日: | 2022-05-10 |
| 发明(设计)人: | 皮德常;邱述媛 | 申请(专利权)人: | 南京航空航天大学 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/28;G06F16/29 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 210016 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 隐私 时空 泛化 轨迹 数据 发布 方法 | ||
1.基于差分隐私的时空泛化轨迹数据发布方法,其主要特征包括如下步骤:
(1)时间泛化:对轨迹位置的时间属性进行聚类,将具有相近时间节点的位置泛化到同一时间段内,生成k个时刻位置空间;
(2)位置泛化:对每个时刻位置空间中的位置点通过密度峰值聚类进行分组,生成候选划分集,利用差分隐私的指数机制选择具有最佳效用的候选分组,对位置点进行空间划分,将每组内所有位置泛化成核心位置;
(3)轨迹数据发布:统计每条泛化轨迹的真实轨迹数,删除假轨迹,利用差分隐私的拉普拉斯机制,向统计值添加随机噪声,并通过一致性约束对加噪数据进行后置处理,发布泛化轨迹和加噪统计值。
2.根据权利要求1所述的基于差分隐私的时空泛化轨迹数据发布方法,其特征在于,步骤(1)时间泛化,其实现方法包括:
(2-1)设定k值和初始质心进行时刻归类:k表示将轨迹集中所有位置的时间属性划分为k个时间段,随机选择k个时刻作为初始质心,根据时刻间的欧氏距离将每个时刻归类到距其最近的质心时刻所在的类簇中;
(2-2)根据新划分的簇,重新计算质心,循环执行步骤(2-1)直到前后质心的距离值之差小于阈值;
(2-3)生成时刻位置空间:选取每聚簇的质心时刻作为该聚簇中所有轨迹位置点的时间戳,将具有相近时间节点的位置泛化到同一时间段内,生成k个时刻位置空间Γ。
3.根据权利要求1所述的基于差分隐私的时空泛化轨迹数据发布方法,其特征在于,步骤(2)位置泛化,其实现方法包括:
(3-1)位置空间密度峰值聚类:计算每个位置点的局部密度ρ和相对距离δ,选择ρ和δ都比较大的数据点为聚类中心,将剩余位置点分配到有更高密度的最近邻所属的类簇;
对于任意的位置点pi∈Γ,1≤i≤|D|,其局部密度ρi与相对距离δi为:
其中,dij为位置点pi与pj间的欧氏距离,dc为截断距离;
(3-2)生成候选划分集:通过密度峰值聚类算法将时刻位置空间Γi中所有位置聚为mi1簇,将此划分策略记为Pi1,接下来每次删除x条D中的不同轨迹再进行聚类,得到|D|种划分;生成候选划分集τi,τi共包含1+|D|种划分结果;
(3-3)选择具有最佳效用的候选划分:通过指数机制定义评估函数U对每一个候选划分方案计算出一个评估值,根据评估值在τi中概率性地选择一种划分Pij作为最佳候选划分;
针对τi中的第j个(1≤j≤g)候选分区Pij,其评估值为:
(3-4)选取Pij对ti时刻的划分作为Γi的划分结果,用各簇的聚类中心代替本簇的所有位置。
4.根据权利要求1所述的基于差分隐私的时空泛化轨迹数据发布方法,其特征在于,步骤(3)轨迹数据发布,其实现方法包括:
(4-1)删除假轨迹:根据各个核心位置生成泛化轨迹,统计每条泛化轨迹的真实轨迹数,删除统计值为零的假轨迹;
(4-2)加噪处理:利用差分隐私的拉普拉斯机制,向泛化轨迹的统计值中添加拉普拉斯随机噪声;
(4-3)轨迹数据发布:通过一致性约束对加噪数据进行后置处理,发布泛化轨迹和其约束后的加噪统计值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210256578.8/1.html,转载请声明来源钻瓜专利网。





