[发明专利]一种全文检索方法、系统、电子设备及存储介质在审
申请号: | 202110500852.7 | 申请日: | 2021-05-08 |
公开(公告)号: | CN113127596A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 杜芳 | 申请(专利权)人: | 北京明略昭辉科技有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33 |
代理公司: | 青岛清泰联信知识产权代理有限公司 37256 | 代理人: | 赵燕 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 全文 检索 方法 系统 电子设备 存储 介质 | ||
本申请公开了一种全文检索方法、系统、电子设备及存储介质,全文检索方法包括:索引建立步骤:建立全文索引,将参与检索的字段信息写入所述全文索引;检索参数构造步骤:构造检索参数,并抽象所述字段信息的关键词生成DSL接口类;查询索引获取步骤:调用DSL抽象方法获得DSL查询索引,将所述DSL查询索引进行组合,获取一完整DSL查询索引;检索步骤:通过所述完整DSL查询索引进行检索以召回相关文档。本发明通过搜索引擎把文档相关的需要参与检索的不同维度的信息划分成不同字段做索引,快速精准召回和用户意图强相关的文档,增强了非结构化数据检索意图的表达能力,提高了召回数据的准确度。
技术领域
本申请涉及检索技术领域,尤其涉及一种全文检索方法、系统、电子设备及存储介质。
背景技术
在大多现有技术中,通常检索关键词入口只有一个,检索某关键词,通常做法是对索引中每个参与检索的字段都与关键词进行匹配,某个文档只要有一个字段匹配成功即视为命中,综合所有参与检索的字段的匹配程度进行相关度排序,这样做虽然能召回相关文档,但采用这种方式通常无法表达用户针对特定字段,特别是多个字段,每个字段不同关键词的精确检索意图,从而导致和用户意图强相关的文档排序却很有可能靠后。例如,用户的意图是搜索作者为张三,发表时间为2021-01-01的书籍,如果用传统的检索方式,输入“张三2021-01-01”,标题为“张三2021-01-01一夜暴富”的文档排序很可能靠前,而作者为张三,发布时间为2021-01-01的书籍排序却很可能靠后,因而通过现有技术无法快速高效精准定位以及获得与客户检索意图高度相关的信息。
发明内容
本申请实施例提供了一种全文检索方法、系统、电子设备及存储介质,以至少通过本发明解决了全文检索过程中无法快速、高效、精准定位客户检索意图强相关的信息等问题。
本发明提供了全文检索方法,包括:
索引建立步骤:建立全文索引,将参与检索的字段信息写入所述全文索引;
检索参数构造步骤:构造检索参数,并抽象所述字段信息的关键词生成DSL接口类;
查询索引获取步骤:调用DSL抽象方法获得DSL查询索引,将所述DSL查询索引进行组合,获取一完整DSL查询索引;
检索步骤:通过所述完整DSL查询索引进行检索以召回相关文档。
上述的全文检索方法,所述索引建立步骤包括,建立所述全文索引后,抽取每个参与检索的文档中需要检索的所述字段信息,并将每个所述字段信息写入所述全文索引。
上述的全文检索方法,所述检索参数构造步骤包括,构造所述检索参数,并抽象单个所述字段信息对应的所述关键词生成的所述DSL接口类后,根据不同的所述字段信息实现所述DSL接口类。
上述的全文检索方法,所述查询索引获取步骤包括:
选取步骤:根据所述检索参数的key选取适合每个kv对的所述DSL接口类;
生成步骤:调用genDSL生成所述kv对的所述DSL查询索引后,将所有的所述DSL查询索引用与的关系进行组合,生成所述完整DSL查询索引。
本发明还提供全文检索系统,其中,适用于上述所述的全文检索方法,所述全文检索系统包括:
索引建立单元:建立全文索引,将参与检索的字段信息写入所述全文索引;
检索参数构造单元:构造检索参数,并抽象所述字段信息的关键词生成DSL接口类;
查询索引获取单元:调用DSL抽象方法获得DSL查询索引,将所述DSL查询索引进行组合,获取一完整DSL查询索引;
检索单元:通过所述完整DSL查询索引进行检索以召回相关文档。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略昭辉科技有限公司,未经北京明略昭辉科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110500852.7/2.html,转载请声明来源钻瓜专利网。