[发明专利]一种云网络中面向加密云数据多关键词匹配排序搜索方法在审
申请号: | 201810306668.7 | 申请日: | 2018-04-08 |
公开(公告)号: | CN108563732A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 刘良桂;孙辉;贾会玲;张宇 | 申请(专利权)人: | 浙江理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310018 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 排序 关键词匹配 评分算法 云网络 搜索 匹配关键词 建立索引 匹配类型 搜索过程 搜索结果 搜索效率 算法结合 索引存储 映射 算法 维度 文档 索引 加密 匹配 | ||
本发明公开一种云网络中面向加密云数据多关键词匹配排序搜索方法,该方法采用多关键词的形式建立索引,使得从一篇文档中提取的多个关键词通过综合评分算法映射到索引的一个维度上,同时在搜索过程中采用匹配得分算法,这种算法结合综合评分算法使得搜索结果能够根据匹配类型和匹配关键词的多少来进行排序,因此本发明的方法减少了索引存储开销,排序精度高,且加密和搜索效率高。
技术领域
本发明涉及云网络中加密数据排序检索领域,特别涉及一种云网络中面向加密云数据多关键词匹配排序搜索方法。
背景技术
为了节省本地存储开销,越来越多的人选择将私人数据存放在不可信的远程服务器中。然而云存储环境存在着潜在的风险,近年来数据泄露事件屡见不鲜,很多人为了利用便捷的云服务,只好将自己的隐私数据加密后上传到云端。尽管加密增大数据利用难度,但却可以保护隐私数据的安全性。在不可信的云环境下,很多学者已经针对不同的云存储服务问题提出了自己的解决方案。他们的工作集中在设计一个可搜索的加密索引上,这种索引能够对服务器隐藏文档的信息,并且只能通过特定的陷门进行运算。可搜索加密的索引方式可以是通过关键词映射生成的布隆过滤器,也可以是反映关键词重要程度的索引向量。但是这些可搜索加密方案存储开销大并且搜索精度较低。
在可搜索加密过程中,寻找一种能够满足用户准确查询的方案尤为困难。虽然现在已经有很多支持多关键词查询的可搜索加密方法,但是它们没有考虑到提取的关键词具有模糊性和多意性。现有的方法评判一个关键词对于一篇文档重要程度尚不够完善,并且当从文档中提取关键词数量较多时,必然会造成巨大的索引开销,进而影响加密和检索效率。针对搜索结果缺失或不完整问题,很多学者提出了模糊关键词搜索和排序搜索方案。这些方案很大程度上丰富了搜索结果,但是返回的结果往往与用户的搜索意图不符。
众所周知,在明文文档查询过程中通过短语查询方法被广泛应用并取得了较好的查询效果。最近,很多学者开始将以短语或连续关键词查询的方法运用在密文搜索系统中。相比于多关键词或联合关键词密文查询方法,支持短语查询的可搜索加密方式能获得更高的查询精度。但是随着从文档中提取词语数量增多,短语查询将会造成巨大的计算开销,并且与词语数量呈线性增长趋势。因此寻找一种既能降低计算量又能准确返回搜索结果的查询方案,已经是一个亟待解决的问题。
发明内容
本发明针对现有技术的不足提出一种云网络中面向加密云数据多关键词匹配排序搜索方法,该方法更加注重查询请求中关键词与词典集中关键词的匹配关系,并且综合考虑每一种匹配情况,使查询结果更贴近用户的真实需求,具体技术方案如下:
一种云网络中面向加密云数据多关键词匹配排序搜索方法,其特征在于,该方法包括如下步骤:
S1:设从第i篇文档中提取的关键词组成的集合为gi,所有文档的关键词集组成的集合记为G,由G中所有不重复的元素组成的集合记为词典集D,记dj为词典集D中第j个关键词词典,计算gi∩dj中第b个关键词vi,b的归一化词频TF(vi,b):
其中,wi,k表示第i篇文档中提取的第k个关键词,fi,k和fi,b分别表示关键词wi,k和vi,b在第i篇文档中出现的次数。
S2:根据数据所有者提供的词典集D中关键词词典的个数n,创建一个n维的索引向量索引向量的第j(j=1,2,...,n)维是一个关键词词典dj(j=1,2,...,n)中的所有关键词在第i篇文档Fi中的综合评分CS,所述的综合评分CS的计算过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江理工大学,未经浙江理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810306668.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种情感分类方法及装置
- 下一篇:一种基于贝叶斯推理的土地利用数据同化方法