[发明专利]基于HMM的用户查询风险评估和隐私保护方法有效
申请号: | 201910072616.2 | 申请日: | 2019-01-25 |
公开(公告)号: | CN109918939B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 徐光伟;马永东;王文涛;史春红;赖淼麟 | 申请(专利权)人: | 东华大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹;柏子雵 |
地址: | 201600 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 hmm 用户 查询 风险 评估 隐私 保护 方法 | ||
本发明提供了一种基于隐马尔克夫模型(Hidden Markov Model,HMM)的用户查询风险评估和隐私保护方法。通过对用户查询的特征进行分析,将分析得到的指标将其作为HMM的量化指标,建立用户查询风险评估模型;初始化模型参数;根据可见状态序列以及系统的真实状态,对模型进行训练;最后当用户查询,对用户查询风险计算以及风险等级评估。本发明利用HMM模型对用户查询安全风险进行评价,考虑各阶段的动态性,实时反应风险状态。针对高风险查询采用高强度的差分噪音来降低用户查询风险,针对低风险查询采用低强度的差分噪音进行保护,不仅有效解决了用户查询时隐私泄露的风险,而且节约了隐私保护成本。同时该模型具有很强的扩展性,可以应用到各种在线查询服务中。
技术领域
本发明涉及一种基于HMM模型的用户查询风险评估和隐私保护方法,属于WEB数据查询、隐私保护领域。
背景技术
近年来,在线查询服务为人们信息检索中带来极大的便利,但也随之带来了各种隐私泄露问题。用户在使用各种在线查询服务时,留下一系列包含个人信息、兴趣爱好和查询意图的数字痕迹,这些数字痕迹中包含着用户丰富的敏感信息,一旦泄露会对用户造成严重的危害。如攻击者(不可信服务提供商或第三方营销商)通过分析用户数据痕迹来推断用户真实查询意图。推断用户正在寻找什么,何时以及在什么情况下用户发起查询操作,以便提供更多相关和定制的诱导内容或广告来诱导用户盲目消费或者是欺骗用户。这使得用户无法控制以滥用其个人信息的“好奇”系统进行有针对性的广告和数字歧视,引起了公众对隐私侵权的严重关注。
在用户查询中,传统的隐私保护的方法主要集中在隐私的可识别方面,即敏感信息删除,安全通信,匿名查询和数据混淆来改善用户在线查询时的隐私保护问题。虽然已经做了一些工作,但依旧存在严重的隐私泄露问题,如加密成本高,灵活性差等问题使得以上方法没有得到广泛的应用。
现有的隐私保护方法主要有查询混淆和覆盖查询的解决方案。查询混淆是通过生成虚拟查询与用户的真实查询一起发送到服务提供端,以防止对搜索服务方对用户查询的准确推断。覆盖查询是通过采用潜在语义索引的方法来生成掩盖查询以隐藏用户的原始查询。但是,以上方法中均忽略了用户查询时查询风险高低区分的问题。在实际查询场景中,用户的每次查询并不都涉及到隐私,即每次查询并不都是高风险的,如果采用相同的隐私保护方法很容易造成隐私保护强度过高导致用户查询准确性低以及查询效率低等问题。
HMM模型是序列数据处理和统计学习的一种重要概率模型,具有建模简单、数据计算量小、运行速度快、识别率高等特点。HMM已广泛应用于模式识别、词性标注和信息提取方面,很好的结合了定性与定量的方法,具有相对准确的评估准确度。
发明内容
本发明的目的是:将HMM应用在用户查询风险评估和隐私保护中,有效地解决用户在查询时查询内容风险高低的判断,并对高风险查询用户采用隐私保护策略保护,防止用户查询时导致用户隐私泄露的问题。
为了达到上述目的,本发明的技术方案是提供了一种基于HMM的用户查询风险评估和隐私保护方法,其特征在于,包括以下步骤:
步骤1、用户发起查询请求,根据用户查询请求中所包含的查询内容进行查询特征分析,获得用户查询特征;
步骤2、基于用户查询特征,建立HMM模型;
步骤3、初始化模型参数,根据HMM模型的可见状态序列及系统的真实状态,对HMM模型进行训练;
步骤4、利用训练好的HMM模型对用户实时发起的查询请求所包含的查询内容进行风险评估和风险值计算,确定查询风险等级;
步骤5、针对不同的查询风险等级,采用不同的隐私保护措施:当查询风险等级为高风险查询时,采用高强度的差分隐私噪音降低查询风险;当查询风险等级为低风险查询时,采用低强度的差分隐私噪音实现保护;
步骤6、将隐私保护后的结果发送给服务提供商,服务提供商根据用户的查询需求进行结果查询;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910072616.2/2.html,转载请声明来源钻瓜专利网。