[发明专利]一种通用的全文搜索方法有效

专利信息
申请号: 201210525753.5 申请日: 2012-12-07
公开(公告)号: CN102968501A 公开(公告)日: 2013-03-13
发明(设计)人: 倪时龙;余深田;宋立华;郑映;谭翔 申请(专利权)人: 福建亿榕信息技术有限公司;国家电网公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 福州市鼓楼区京华专利事务所(普通合伙) 35212 代理人: 宋连梅
地址: 350000 福建省福*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 通用 全文 搜索 方法
【说明书】:

【技术领域】

发明涉及一种全文搜索方法。

【背景技术】

随着企业信息化建设的逐步深入和发展,企业中存在大量的结构化数据(指存储在关系型数据库中,可以用二维表结构来表达的数据类型)和非结构化数据(或叫电子文件,与结构化数据相比,不便于采用二维表结构来表达的数据类型即称为非结构化数据,可包括各种主流格式的办公文档、图片、XML、HTML、各类报表、图像和音频)。其中70%的数据都是非结构化数据,现在越来越多的企业中的非结构化数据都是采用集中存储的方式,也就是将各业务系统的电子文件数据集中存在的一个平台上,如:将ERP(Enterprise Resource Planning企业资源计划系统)系统的合同、人资、协同办公系统的公文集中存储在同一个非结构化管理平台,这些资源中包含有大量有益于企业提升综合效益的信息,都是企业的重要资产。这些电子文件通常都有密级要求,也就是说并非企业中的所有用户都有权访问这些电子文件,只有部分用户才能接触到该电子文件。

鉴于以上问题,搜索引擎搜索存储在同一平台的电子文件,通过有效的资源控制手段,保证授权资源电子文件的访问控制和检索需求,这样才能保证密级电子文件的存储安全,同时又不影响授权用户的访问要求。目前业内主要通过如下几种方法来实现这种权限访问控制:

1、由业务系统本身依据登录的权限进行判断:也就是只要有权限登录系统,就有权限访问搜索到的任何信息,因此所有的用户都有可能看到授权范围以外的信息,故本方法存在较大的缺陷和不足。

2.通过分类条件过滤方法来实现对搜索数据的访问控制:建立统一的信息分类体系,并对所有数据进行分类标注,数据的检索及授权都基于这一分类体系,可以提前为用户指定其可以访问的数据分类范围,在获得用户提交的检索请求后,根据用户的授权范围,对检索条件中指定的分类条件进行过滤,确保检索操作被限定在用户授权的范围内。但本方法对访问控制的最小单位是数据分类,无法实现基于单条数据记录级别的访问控制。如公开日为2008.07.16,公开号为CN101221584,申请号为200810057417.6的中国发明揭示了一种“搜索引擎、搜索方法和系统”,一方面提供一种搜索引擎,包括:访问控制单元,用于根据用户信息确定搜索范围;搜索单元,用于根据所述搜索范围进行搜索。相应地提供一种搜索方法,包括如下步骤:根据用户信息确定搜索范围;根据所述搜索范围进行搜索。并且还提供一种搜索系统,包括资源库系统,还包括访问控制单元,用于根据用户信息确定搜索范围;搜索引擎,用于根据所述搜索范围对所述资源库系统进行搜索。其是使用分类方法对授权对象进行分类,然后给用户定义授权分类,用户只能检索分类中的授权对象,但无法解决细粒度、记录集的授权。

3.采用对搜索结果集进行过滤的控制方法:即在检索操作完成后对搜索结果进行过滤的一种控制方法。具体为在获取检索结果集后,对其中的数据逐条进行授权判断,只返回用户授权范围内的结果数据。采用本方法是,只有对结果集内所有的数据都完成授权判断后,才能计算出本次检索有效的命中结果数。当结果集较大时,完成对所有结果的授权判断将成为制约检索性能的瓶颈。如公开日为2011.11.30,公开号为CN102262633A,申请号为201010189001.7的中国发明一种面向全文检索的结构化数据安全检索方法,包括a)根据检索用户提供的关键词在索引中提取检索记录;b)从所述检索记录中取出一条业务数据的内容和GUID,并获取当前检索用户的GUID,c)将取出的业务数据的GUID与数据访问控制表中业务数据的GUID进行匹配;d)将当前检索用户的GUID与数据访问控制表中匹配成功的业务数据对应的用户GUID进行匹配,若匹配成功则将该业务数据放在检索结果中,若匹配不成功则删除检索记录中的该条业务数据;e)判断检索记录中是否还有业务数据,如果判断结果为是则返回步骤b)。该发明提供的检索方法使得业务数据权限发生变化不必变更索引也可实现安全检索,可大大提高检索的方便性。但其采用对结果集的过滤控制方法,将所有授权数据创建唯一的GUID,再将GUID授权给用户,建立授权列表;然后与通过搜索引擎检索出的结果进行比较,如果搜索出的记录GUID存在在授权列表中,就判定为有权访问的记录,否则则删除该搜索记录。该方法的一个较大的缺陷就是当检索数据较大时,会严重影响搜索性能。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建亿榕信息技术有限公司;国家电网公司,未经福建亿榕信息技术有限公司;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210525753.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top