[发明专利]一种文件搜索方法及计算设备在审
申请号: | 202110896464.5 | 申请日: | 2021-08-05 |
公开(公告)号: | CN113535642A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 胡建忠;杨浩;杨武 | 申请(专利权)人: | 统信软件技术有限公司 |
主分类号: | G06F16/13 | 分类号: | G06F16/13;G06F16/14;G06F16/16;G06F16/31 |
代理公司: | 北京瀚方律师事务所 11774 | 代理人: | 周红力 |
地址: | 100176 北京市大兴区北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文件 搜索 方法 计算 设备 | ||
1.一种文件搜索方法,在计算设备的操作系统中执行,所述方法包括:
接收客户端对文件的搜索请求,从所述搜索请求中获取搜索信息;
基于所述搜索信息从索引列表中查找相关联的一个或多个第一索引;
确定每个第一索引对应的文件的修改时间是否改变;
对于每个第一索引,如果第一索引对应的文件的修改时间未改变,则将所述第一索引作为第一搜索结果;
如果第一索引对应的文件的修改时间改变,则基于修改时间改变的文件来更新索引列表,并基于所述搜索信息从更新后的索引列表中查找相关联的一个或多个第二索引,将一个或多个第二索引作为第二搜索结果;以及
基于所述第一搜索结果和第二搜索结果得到最终搜索结果,并将所述最终搜索结果返回至客户端。
2.如权利要求1所述的方法,其中,将所述最终搜索结果返回至客户端的步骤包括:
获取所述第一搜索结果与第二搜索结果的并集,作为最终搜索结果;
将所述最终搜索结果中的每个索引对应的文件返回至客户端。
3.如权利要求1或2所述的方法,其中,将所述最终搜索结果返回至客户端的步骤包括:
将第一搜索结果中的每个第一索引对应的文件返回至客户端;
从第二搜索结果中去除与第一搜索结果相重复的第二索引,并将去重后的一个或多个第二索引对应的文件返回至客户端。
4.如权利要求1-3中任一项所述的方法,其中,将所述最终搜索结果返回至客户端的步骤包括:
基于所述索引列表确定与所述最终搜索结果中的每个索引相关联的一个或多个文件的描述文档,所述描述文档中包括文件的描述信息;
将所述最终搜索结果中的每个索引对应的文件的描述信息返回至客户端,以便在客户端显示每个索引对应的文件的描述信息。
5.如权利要求1-4中任一项所述的方法,其中,确定每个第一索引对应的文件的修改时间是否改变的步骤还包括:
如果每个第一索引对应的文件的修改时间均未改变,则将所述第一搜索结果返回至客户端。
6.如权利要求1-5中任一项所述的方法,其中,
所述索引列表为倒排索引列表,所述倒排索引列表中包括多个索引,所述索引为词汇单元;
其中,每个索引分别关联一个或多个文件的描述文档,所述描述文档中包括文件名、文件路径、修改时间、文件内容中的一种或多种描述信息。
7.如权利要求1-6中任一项所述的方法,其中,在接收客户端对文件的搜索请求之前,包括步骤:
获取多个文件;
基于每个文件创建相应的描述文档,所述描述文档包括一个或多个域,其中,每个域包括所述文件的路径、修改时间以及与所述域相对应的文件内容;
基于多个文件对应的描述文档来创建索引列表。
8.如权利要求7所述的方法,其中,基于多个文件对应的描述文档来创建索引列表的步骤包括:
基于多个描述文档中的域的文件内容提取多个词汇单元,并基于每个词汇单元创建相应的索引,以便生成倒排索引列表。
9.一种计算设备,包括:
至少一个处理器;以及
存储器,存储有程序指令,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1-8中任一项所述的方法的指令。
10.一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如权利要求1-8中任一项所述方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于统信软件技术有限公司,未经统信软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110896464.5/1.html,转载请声明来源钻瓜专利网。