[发明专利]一种管理非结构化数据的方法及装置有效
申请号: | 201210250348.7 | 申请日: | 2012-07-19 |
公开(公告)号: | CN103577406B | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 孟进;马春光 | 申请(专利权)人: | 深圳中兴网信科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/31 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 张颖玲;任媛 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 管理 结构 数据 方法 装置 | ||
本发明公开了一种管理非结构化数据的方法,包括:利用正则表达式,建立一个或多个匹配规则;利用匹配规则,对当前保存的所有非结构化数据进行分组;选出一组非结构化数据,对该组对应的匹配规则进行调整,利用调整后的匹配规则对该组非结构化数据进行调整。本发明还同时公开了一种管理非结构化数据的装置,采用本发明能缩短搜索周期,提高查找准确度及扩展性。
技术领域
本发明涉及数据管理领域,尤其涉及一种管理非结构化数据的方法及装置。
背景技术
所有信息分为两类:一类信息能够用数据或统一的结构加以表示,成为结构化数据,如数字、符号等;另一类信息无法用数字或统一的结构表示,比如文本、图片、网页、各类报表、图像和音频/视频信息等等。随着网络技术的发展非结构化数据的数量日趋增大。
目前,对非结构化数据进行管理,主要使用全文索引技术,具体的:建立倒排索引文件,根据关键字对非结构化数据进行内容检索,再对检索到的内容进行处理。但是,这种对非结构化数据进行管理的方法,由于每次索引都需要进行全文搜索,且只能对预置的关键字进行搜索,无法根据需要进行扩展以便更准确的查找。
可见,现有技术中对非结构化数据库信息进行管理,存在搜索周期长、查找准确度不高、以及扩展性差的问题。
发明内容
有鉴于此,本发明的目的在于提供一种管理非结构化数据的方法及装置,能缩短搜索周期,提高查找准确度及扩展性。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供了一种管理非结构化数据的方法,该方法包括:
利用正则表达式,建立匹配规则;
利用匹配规则,对当前保存的所有非结构化数据进行分组;
选出一组非结构化数据,对该组对应的匹配规则进行调整,利用调整后的匹配规则对该组非结构化数据进行调整。
上述方案中,所述匹配规则,包括:对匹配的字段、及所述匹配的字段对应的格式的定义。
上述方案中,所述对当前保存的所有非结构化数据进行分组,包括:使用当前保存的所有非结构化数据,逐个与当前建立的各条匹配规则进行匹配,并将与匹配规则匹配的非结构化数据保存在该条匹配规则对应的信息存储列表。
上述方案中,所述对该组对应的匹配规则进行调整,包括:针对当前选出的一组非结构化数据,对该组对应的匹配规则中字段以及字段格式做出添加、修改或删除等修改。
上述方案中,所述利用调整后的匹配规则对该组非结构化数据进行调整为:使用当前分组对应的信息存储列表中记录的所有非结构化数据,与调整后的匹配规则进行匹配,将与调整后的匹配规则匹配的非结构化数据,保存在该条调整后的匹配规则下对应的信息存储子列表中。
本发明还提供了一种管理非结构化数据的装置,该装置包括:匹配规则定义模块、分析模块和调整模块;其中,
匹配规则定义模块,用于利用正则表达式,建立匹配规则,并将匹配规则发给分析模块;
分析模块,用于利用匹配规则定义模块发来的匹配规则,对所在设备中当前保存的所有非结构化数据进行分组,选出一组非结构化数据,将该组非结构化数据对应的匹配规则发送给调整模块,以及根据调整模块发来的调整后的匹配规则对该组非结构化数据进行调整;
调整模块,用于接收分析模块发来的匹配规则,对该匹配规则进行调整,将调整后的匹配规则发给分析模块。
上述方案中,所述匹配规则定义模块,具体用于对匹配的字段、及所述匹配的字段对应的格式进行定义作为匹配规则。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳中兴网信科技有限公司,未经深圳中兴网信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210250348.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:绝缘电线
- 下一篇:一种可燃性气体过滤装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置