[发明专利]一种分布式安全检索系统无效
申请号: | 200910272426.1 | 申请日: | 2009-10-16 |
公开(公告)号: | CN101694672A | 公开(公告)日: | 2010-04-14 |
发明(设计)人: | 李瑞轩;高国强;文坤梅;辜希武;吴炜;卢正鼎;胡和平;路松峰;左翠华;燕昆 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F21/00 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 曹葆青 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 安全 检索系统 | ||
技术领域
本发明属于计算机信息检索技术和信息安全技术领域,具体涉及一种分布式安全检索系统。
背景技术
计算机技术的发展大大提高了文档管理的效率,信息检索技术更是将电子文档的管理效率提高到了极致。通过对文档建立倒排索引,可以实现基于索引项(Term)的快速检索。目前绝大部分信息检索系统都是应用于非涉密普通文档的管理,而在军事、政府以及大企业等应用领域,需要管理大量的涉密文档,为此,需要一种安全的检索系统来提高涉密文档的管理效率。针对涉密文档的安全检索系统不仅要能实现高效的信息检索,而且要能保证数据的安全。
分布式倒排索引可以用来处理超大数量的文档检索,也就是将倒排索引分布到多个索引服务器上。实现倒排索引分布的常用方法有基于文档的分布和基于索引词的分布。基于文档的分布方法将文档划分为不同的子集,然后将这些子集分布到不同的索引服务器分别建立倒排索引。这种方式的可扩展性高,但搜索效率比较差。基于索引词的分布方法先将文档分词,然后把不同的索引词分布到多个索引服务器,在索引服务器上对索引词及相关信息建立倒排索引。这种方法构建的倒排索引精简,搜索效率高,但可扩展性比较差。
倒排索引的结构为倒排表,其中关键的部分是索引词,因为通过索引词可以重构文档。要保证文档数据的安全,就必须保证倒排索引的安全,尤其是其中索引词的安全。加密是信息安全领域保证数据安全最常用的手段,通过加密索引词,形成密文倒排索引,不仅可以实现文档的高效检索,而且可以保证文档数据的安全。为了处理大规模涉密文档,分布式安全检索系统是一种解决方案。基于文档的密文倒排索引分布由于倒排索引冗长,检索效率比较低。目前基于索引词的密文倒排索引分布方法中,由于相同的明文索引词对应相同的密文索引词,存在较高的统计攻击风险。无论是基于文档还是基于索引词的密文倒排索引分布方法中,管理服务器都要把检索请求分布到多个索引服务器进行检索,接收返回结果并合并这些检索结果。因为每个索引服务器包含大量的检索结果,如果一个检索请求被分布到许多索引服务器,会大大增加管理服务器的通信开销,可能导致管理服务器成为通信瓶颈节点。本发明提出了一种分布式安全检索系统,可以实现大规模涉密文档的高效检索和安全性要求,同时降低了密文倒排索引遭受统计攻击的风险,而且也考虑了管理服务器的通信负载均衡问题。
发明内容
本发明的主要目的在于提供一种分布式安全检索系统,具有对大规模涉密文档建立分布式密文倒排索引和进行分布式检索两大功能,从而实现对涉密文档的安全管理;本发明的进一步的目的是提供一种适用于所述检索系统的分布式索引方法和分布式检索方法,从而更好地实现对涉密文档的安全管理。
本发明提供的一种分布式安全检索系统,包括n个用户客户端,管理服务器,m个索引服务器,加密服务器以及密钥矩阵,n为正整数,表示用户客户端的个数,m为大于等于2的正整数,表示索引服务器的个数,用户客户端通过互联网与管理服务器连接,管理服务器、索引服务器和加密服务器通过内部网络互连,密钥矩阵存储于管理服务器或加密服务器中;
用户客户端用于用户向管理服务器发起检索请求,通过管理服务器在索引服务器进行检索,并将结果显示给用户,对于管理用户,能够向管理服务器发起索引请求,对提交的文档建立分布式密文倒排索引;
管理服务器用于接收用户客户端请求,执行索引或检索指令,并将索引或检索指令分布后发送到各个索引服务器,执行索引或检索操作,然后接收索引服务器返回结果,将结果传送给用户客户端;
索引服务器用于存储分布式密文倒排索引,并且接收管理服务器发出的索引和检索指令,实现对管理服务器传送过来的索引词建立密文倒排索引和对密文倒排索引进行检索,将索引和检索的处理结果返回给管理服务器;
加密服务器用于接收管理服务器加密请求,按指定密钥实现对索引和检索操作中索引词和检索词的加密,并将加密后的信息返回给管理服务器;
密钥矩阵用于存储索引词和检索词的加密密钥,是由索引词或检索词的加密密钥构成的矩阵,其行号为索引服务器编号,其列号为索引词或检索词密级;密钥矩阵接收管理服务器的访问,获取索引词和检索词的加密密钥,并提供给管理服务器。
作为本发明的改进技术方案,所述分布式安全检索系统将涉密文档按照下述步骤的索引方法建立分布式密文倒排索引:
(A1)在管理服务器,对涉密文档进行分词,形成一系列明文索引词;
(A2)在管理服务器,按照步骤(A21)至(A23)对明文索引词进行处理,得到密文索引词,并传输密文索引词及相关信息到相应索引服务器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910272426.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:燃料高压燃烧直接汽化油田污水装置
- 下一篇:一种灌装拨瓶控制装置