[发明专利]基于HMM的用户查询风险评估和隐私保护方法有效
申请号: | 201910072616.2 | 申请日: | 2019-01-25 |
公开(公告)号: | CN109918939B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 徐光伟;马永东;王文涛;史春红;赖淼麟 | 申请(专利权)人: | 东华大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹;柏子雵 |
地址: | 201600 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 hmm 用户 查询 风险 评估 隐私 保护 方法 | ||
1.一种基于HMM的用户查询风险评估和隐私保护方法,其特征在于,包括以下步骤:
步骤1、用户发起查询请求,根据用户查询请求中所包含的查询内容进行查询特征分析,获得用户查询特征;
步骤2、基于用户查询特征,建立HMM模型,建立HMM模型的方法包括以下步骤:
步骤201、确定用户查询时的可见状态,可见状态包含系统的所有信息,并且在当前状态下的观察是独立的,而且用户的查询内容仅与前一个状态有关;
步骤202、建立隐马尔可夫五元组参数模型,包括状态转移概率矩阵、观测向量的概率矩阵、最初状态概率分布矢量、状态数和观测符号数,每个环节的安全状态概率分布就是下一环节的初始状态概率分布;
步骤3、初始化模型参数,根据HMM模型的可见状态序列及系统的真实状态,对HMM模型进行训练;
步骤4、利用训练好的HMM模型对用户实时发起的查询请求所包含的查询内容进行风险评估和风险值计算,确定查询风险等级,其中:
在建立HMM模型时,结合用户的递进和共现查询特征,从转移概率和观测概率角度进行分析:
转移概率,是指用户给出先前查询数据序列后,再经过若干时间后得到用户的另一查询数据的条件概率,相连的两节点q1,q2之间存在着一个转移概率P(q1→q2);设Xt为HMM中个人可识别敏感信息,则Xt节点之间的转移概率为p(Xt|Xt-1),对节点之间已发生的转换次数count(Xt|Xt-1)进行计算得到α为权重;然后根据加权转移概率的方法计算用户查询中的隐私风险,即α*p(Xt|Xt-1);
观测概率,是指某个节点可能发生的查询行为,如用户ui经过q查询了e的概率为P(e|q),该值基于用户的历史查询数据进行分析和计算获得,每个节点包含一组具有观测概率的观测值,将这些观测概率建模为不同用户在先前数据(p(ui|Xt))中找到的给定数据Xt的概率,用户查询特定主题的数据越多,则对用户兴趣数据的推断精确度越高,该查询风险越高;采用加权计数的方式确定查询风险β*p(ui|Xt),其中,β为权重,
在用户连续查询场景中,设用户当前的查询为XT只与前一查询XT-1相关,如用户在查询一个复杂问题时,当前的查询结果不满足用户的查询需求时,用户会添加或删除前一次的查询内容,所以是满足一阶马尔科夫性质;
用户查询风险评估:
设用户ui查询序列为X1,X2,…,Xn,则针对该用户查询序列输出的观测结果为Y1,Y2,…,Yn,得用户ui查询序列和观测结果的联合分布为:
计算出用户ui的查询序列(X1→X2→…→Xn)所产生的整体隐私风险为:
其中,(HMM|ui)代表用户ui的所有路径的隐私概率列表,这些列表包括用户观察概率大于0的节点,最后,可得用户查询序列为X1,X2,…,Xn时的查询风险为p(X1,…,Xn|ui);
用户查询风险等级划分:用户查询共有五个状态,A1-A5,其中A1表示正常安全状态,A5表示重大危险状况,A2、A3、A4表示危险等级逐级加深;用概率表示,则各个状态表示的风险等级的概率如下表所示:
步骤5、针对不同的查询风险等级,采用不同的隐私保护措施:当查询风险等级为高风险查询时,采用高强度的差分隐私噪音降低查询风险;当查询风险等级为低风险查询时,采用低强度的差分隐私噪音实现保护;
步骤6、将隐私保护后的结果发送给服务提供商,服务提供商根据用户的查询需求进行结果查询;
步骤7、服务提供商将查询到的结果进行返回,在用户端进行结果排名的操作,再次进行隐私保护。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910072616.2/1.html,转载请声明来源钻瓜专利网。