[发明专利]网站支撑数据库安全搜索引擎系统无效

专利信息
申请号: 200810048012.6 申请日: 2008-06-13
公开(公告)号: CN101320373A 公开(公告)日: 2008-12-10
发明(设计)人: 李瑞轩;辜希武;卢正鼎;於光灿;文坤梅;张茂元;丁益斌 申请(专利权)人: 华中科技大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 华中科技大学专利中心 代理人: 曹葆青
地址: 430074湖北*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 网站 支撑 数据库 安全 搜索引擎 系统
【说明书】:

技术领域

发明属于计算机检索技术,具体涉及一种网站支撑数据库安全搜索引擎系统,该系统结合了互联网搜索引擎、数据库全文检索及基于访问控制的搜索引擎等技术,对网站支撑数据库中所存放的网页文本信息及其描述信息建立索引,用户可检索出其权限许可范围内的所有文本资源,并以原始网页的形式展示文本资源。 

背景技术

随着互联网技术的迅猛发展,越来越多的企业和组织用网站的形式发布消息和资源、实现业务流程,这种方式极大地方便了管理者对资源的管理和用户对资源的访问和使用。随着信息资源不断完善丰富、业务流程灵活性要求不断提高,通过静态页面的超级链接的形式访问所有的信息资源已经不够现实,一些资源往往需要用户在特定页面中选择或输入相关条件后才能在网页上显示出来。同时,不同的企业或组织为了自身的利益或其他目的对其网站中的资源实施访问控制,将不同资源的访问权限授予不同的用户群体,访问控制技术在提高资源安全性的同时,也为搜索引擎对资源的检索设置了障碍。 

传统搜索引擎系统通过爬行器对所有的网站资源进行爬行,对所获得的资源通过分词等技术建立全文索引文件,并将所建立的全文索引文件置于服务器端,当用户查询资源时,搜索程序通过分词技术将用户查询条件分解为索引项在已建立的索引文件中进行搜索,并将搜索到的结果反馈给用户。由此可以看出,传统搜索引擎系统无法采集到受控的资源,比如不同权限的用户可访问不同的资源。其次,传统搜索引擎系统注重通用性,不会获取用户身份,因此无法根据用户的不同而返回不同的搜索结果。 

基于访问控制的安全搜索引擎系统对传统搜索引擎系统进行改进,不仅能够对网络中受安全访问控制下的文件进行信息检索,还能够对安全访 问控制下的资源进行分析,并通过用户信息建立索引,自动实现对复杂访问控制环境下受控资源的检索与访问。该系统解决了传统搜索引擎系统不能检索受控资源的问题,可以根据用户身份信息检索到用户权限许可范围内的网页资源,但是该系统只能检索到爬行器所能收集到的网页资源,对于爬行器不能收集到的资源则无能为力,如上文所述,网站中大量的资源往往需要用户在特定页面中选择或输入相关条件后才能在网页上显示出来,对于这部分资源基于访问控制的安全搜索引擎则无法检索。 

数据库全文检索系统对数据库的文本字段建立索引,在索引的支持下能够实现很高的查全率。将数据库全文检索系统直接用于网站支撑数据库存在以下两个问题:第一个问题是安全问题,系统虽然能够保证查全率,但是不能根据用户的身份确定用户所能查看的信息资源,使得该系统无法应用于有受控资源的网站,现有一些数据库全文检索产品通过为用户和资源指定安全标签实现分级访问控制,能够部分解决这个问题,但是由于分级访问控制较为僵化,无法适应于现代电子政务和电子商务的灵活性需求;第二个问题是查询结果显示问题,数据库全文检索系统往往通过定制界面展示检索到的信息资源,而搜索引擎系统往往在检索出信息资源后以原始页面的形式显示该信息,以原始页面的形式显示信息除了更符合用户习惯外,显示页面前还要通过网站的访问控制检查,更加安全。数据库全文检索系统的一个典型代表是北京拓尔思信息技术有限公司的TRS产品,该产品就存在上述的两个问题,一是采用分级访问控制方法,过于僵化不能满足各种组织的灵活的访问控制需求,二是不能以原始网页的形式显示检索出的信息,除了不符合用户习惯外还避开网站的访问控制检查,还存在安全隐患。 

发明内容

本发明的目的在于提供一种网站支撑数据库安全搜索引擎系统,该系统能够对存放网页文本信息的数据库进行深度检索,并且查全率高,安全性强。 

本发明提供的网站支撑数据库安全搜索引擎系统,其特征在于:该系统包括登录模块、访问控制模块、数据库、数据库更新探测模块、信息描述模块、索引模块、索引库和检索模块;

登录模块用于接受用户提供的身份信息并进行认证; 

访问控制模块用于控制用户对资源网页的访问,用户通过登录模块的认证后,从访问控制模块获取用户的角色信息,当用户请求访问资源网页时,访问控制模块对比用户的角色信息和允许访问该资源网页的角色信息进行访问控制,通过访问控制的用户请求被授权访问资源网页;当访问控制模块改变网页文本信息的访问角色信息,访问控制模块向信息描述模块提交网页文本信息的显示网址和改变后的访问角色信息; 

数据库用于支撑网站的运行,存储网页中显示的文本信息以及该文本信息的访问角色信息和显示网址信息; 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810048012.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top