[发明专利]全文检索方法和全文检索装置在审
申请号: | 201710421974.0 | 申请日: | 2017-06-07 |
公开(公告)号: | CN109002444A | 公开(公告)日: | 2018-12-14 |
发明(设计)人: | 师光强;张丹;于晓明;王卿 | 申请(专利权)人: | 北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 全文检索 内存数据库 索引库 全文检索装置 存储域 内存 程序设计 可扩展性 索引更新 系统资源 复杂度 索引 写入 存储 缓解 | ||
1.一种全文检索方法,其特征在于,包括:
在将存储域的数据导入至各个内存的内存数据库时,生成每个内存数据库对应的一个索引库;
将每个所述内存数据库中导入数据的存储域写入对应的索引库,
其中,所述索引库中存储有所述数据的索引。
2.根据权利要求1所述的全文检索方法,其特征在于,在将存储域的数据导入至各个内存的内存数据库时,生成每个内存数据库对应的一个索引库,具体包括:
在将所述存储域的数据导入至所述内存数据库时,对已导入数据执行上载操作,以获取对应的文档文件;
对所述文档文件创建索引,并解析所述文档文件的标识信息;
判断所述文档文件的标识信息是否与所述索引库中的任一预存标识信息匹配;
在判定所述文档文件的标识信息不与所述索引库中的任一预存标识信息匹配时,将所述文档文件的标识信息写入对应的索引库。
3.根据权利要求2所述的全文检索方法,其特征在于,还包括:
在将所述存储域的数据导入至所述内存数据库时,若检测到所述索引的数量大于预设数量,则创建导入任务进程以批量导入所述存储域的数据。
4.根据权利要求2或3所述的全文检索方法,其特征在于,还包括:
在检测到任一所述索引被删除时,创建删除任务进程,以将被删除索引对应的已导入数据删除。
5.根据权利要求2或3所述的全文检索方法,其特征在于,还包括:
在根据所述标识信息确定所述存储域的数据为初次导入时,不对所述已导入数据的执行所述上载操作。
6.一种全文检索装置,其特征在于,包括:
生成单元,用于在将存储域的数据导入至各个内存的内存数据库时,生成每个内存数据库对应的一个索引库;
写入单元,用于将每个所述内存数据库中导入数据的存储域写入对应的索引库,
其中,所述索引库中存储有所述数据的索引。
7.根据权利要求6所述的全文检索装置,其特征在于,所述生成单元还包括:
上载子单元,用于在将所述存储域的数据导入至所述内存数据库时,对已导入数据执行上载操作,以获取对应的文档文件;
创建子单元,用于对所述文档文件创建索引,并解析所述文档文件的标识信息;
判断子单元,用于判断所述文档文件的标识信息是否与所述索引库中的任一预存标识信息匹配;
所述写入单元还用于:在判定所述文档文件的标识信息不与所述索引库中的任一预存标识信息匹配时,将所述文档文件的标识信息写入对应的索引库。
8.根据权利要求7所述的全文检索装置,其特征在于,
所述创建子单元还用于:在将所述存储域的数据导入至所述内存数据库时,若检测到所述索引的数量大于预设数量,则创建导入任务进程以批量导入所述存储域的数据。
9.根据权利要求7或8所述的全文检索装置,其特征在于,
所述创建子单元还用于:在检测到任一所述索引被删除时,创建删除任务进程,以将被删除索引对应的已导入数据删除。
10.根据权利要求7或8所述的全文检索装置,其特征在于,还包括:
所述上载子单元还用于:在根据所述标识信息确定所述存储域的数据为初次导入时,不对所述已导入数据的执行所述上载操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京北大方正电子有限公司,未经北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710421974.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文本信息的分类方法及装置
- 下一篇:一种智能化的水产养殖信息管理系统