[发明专利]一种针对密文域的形近汉字全文模糊检索方法有效
申请号: | 201810121448.7 | 申请日: | 2018-02-07 |
公开(公告)号: | CN108334612B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 吴翊铭;赵搏文;唐韶华 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F40/289;H04L9/40 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 密文域 汉字 全文 模糊 检索 方法 | ||
本发明公开了一种针对密文域的形近汉字全文模糊检索方法,该方法基于对称可搜索加密方案以及倒排索引结构实现中文密文域模糊搜索,支持字形相似汉字在密文状态下的模糊搜索且保证搜索结果有序,支持多关键词逻辑连接模糊搜索。本发明采用分布式搜索引擎Lucene和中文分词器IKAnalyzer对文档进行全文分词,通过建立的3755个常用汉字的形近字字库构建包含形近字的明文倒排索引,考虑倒排索引结构的安全,将明文倒排索引中的每一个关键词及其对应的文档编号构造成加密链形式,并采用B+树结构来加速搜索。本发明在无误检和无漏检的情况下实现了半可信云服务器的中文全文密文域模糊搜索。
技术领域
本发明涉及信息安全技术领域,具体涉及一种针对密文域的形近汉字全文模糊检索方法。
背景技术
近年来随着具有按需服务、高可扩展等特征的云存储技术的发展,数据拥有者越来越多的将数据外包存储到云服务器。虽然云存储服务给数据拥有者带来极大的便利,但也带来了相应的数据安全挑战。尤其当存储到云服务器上的数据涉及数据拥有者的机密和隐私时,若存储在云服务器上的数据遭受来自内部或外部的攻击,则易造成数据的泄露,危及数据拥有者的数据安全,这种情况无论对数据拥有者还是对云存储服务提供商都会造成重大的经济损失。
为了保证数据的安全,数据拥有者通常会对数据进行加密再上传至云服务器,当上传的数据量较大时,对称加密算法是适合且可用的方式。然而,传统的对称加密算法并不支持密文域中的数据搜索,即数据加密会影响数据的可用性。对称可搜索加密是允许用户搜索加密数据的一种方法,这种方法要求用户准确输入需查询的关键词,云服务器将匹配的文件返回给用户;但在真实场景中,由于中文汉字形近字的普遍存在,用户键入错别字的情况也很常见。因此,加密数据上的模糊搜索成为可搜索加密中的基本需求。现有的针对中文模糊可搜索密文方案主要是利用汉字拼音的字母相近性来实现模糊搜索,由于汉字存在多音字,即同一个拼音会对应多个汉字。生成搜索陷门时,无论采用输入汉字转换为拼音的方式或直接用拼音构造搜索陷门都会影响搜索关键词的语义信息,所以基于拼音的模糊搜索会影响搜索结果的准确率。另一方面,基于汉字字形相近的模糊搜索很好地保留搜索关键词的语义信息,是一种更准确的模糊搜索方式。
发明内容
本发明的目的在于提供一种针对密文域中的形近汉字全文模糊搜索方法,旨在解决中文模糊搜索设计的可用性较低的问题,该发明提出在半可信云服务器中基于对称可搜索加密以及构建的形近字库来完成汉字全文密文域的模糊搜索方案,在非安全的信道下,支持基于对称可搜索加密方案的密文搜索功能,支持保序的中文密文模糊关键词搜索,支持多关键词的中文密文搜索。
本发明的目的可以通过采取如下技术方案达到:
一种针对密文域的形近汉字全文模糊检索方法,所述的方法包括下列步骤:
S1、生成倒排索引,利用分布式搜索引擎Lucene和中文分词器IKAnalyzer对待上传的文档集合进行全文分词,获取待上传文档集合的明文倒排索引,通过分析常用中文的形近字构建中文形近字字典库,利用该中文形近字字典库对待上传文档集合的明文倒排索引进行扩展;
S2、数据加密,给定安全参数k,数据拥有者根据安全参数k,建立可搜索加密密钥Kindex=(K1,K2),用于加密和构建密文索引;建立对称加密密钥Kenc,用于加密待上传文档;使用可搜索加密密钥Kindex对步骤二得到的倒排索引进行加密,使用对称加密密钥Kenc对待上传文档进行加密;
S3、用户授权,数据拥有者将可搜索加密密钥Kindex分割成(Ku,Pu),Ku发给授权用户,Pu作为服务器验证参数,完成用户授权;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810121448.7/2.html,转载请声明来源钻瓜专利网。