[发明专利]一种基于语义理解的智能检索系统及方法在审
申请号: | 202111575120.0 | 申请日: | 2021-12-21 |
公开(公告)号: | CN114238581A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 李欣欣;卢凤;吴士伟;辛国茂;李钊;孙露 | 申请(专利权)人: | 山东亿云信息技术有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/335;G06F16/338;G06F40/289;G06F40/30 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 朱忠范 |
地址: | 250014 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 理解 智能 检索系统 方法 | ||
本公开提供了一种基于语义理解的智能检索系统及方法,包括:配置单元,其用于对检索参数进行配置,生成检索模板;语义检索单元,其用于基于所述检索模板中的参数,采用语义特征提取方法对待检索信息进行语义特征提取;基于提取的语义特征以及相似度计算方法,从所述检索模板绑定的数据集中获取第一检索结果;关键词检索单元,其用于从待检索信息中进行关键词提取,基于提取的关键词从所述检索模板绑定的数据集中获取第二检索结果;检索结果获取单元,其用于基于所述检索模板中的排序方式,将所述第一检索结果与第二检索结果进行合并排序,获得检索结果。
技术领域
本公开属于大数据检索技术领域,尤其涉及一种基于语义理解的智能检索系统及方法。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
随着网络信息的不断发展,企业沉淀了数以万计的数据信息,而如何将这些数据快速提供准确给用户,并且根据用户的喜好推送数据成为了该思考的问题。
发明人发现,按照传统的方式,需要技术人员通过编写接口的方式,将数据按照一定的格式传输给外部,这种方式存在着比较大的局限性,比如客户的需求如果发生改变,就需要开发人员来修改代码调整接口,同时为了满足不同的数据需求,开发人员可能会在同一个接口中做不同的适配或者写不同的接口来满足需求,这样不仅耗时耗力,还会造成代码的冗余,对于后期的维护不利,同时,传统的检索模式均是采用关键词检索模式,无法准确捕捉用户的需求,同时也无法根据用户的喜好来进行推荐。
发明内容
本公开为了解决上述问题,提供了一种基于语义理解的智能检索系统及方法,所述方案通过基于用户的自定义配置,根据业务需求配置接口的请求参数、排序方式、返回参数,最终生成检索接口替代了传统的技术人员开发;同时,所述方案通过将语义检索与关键词检索相结合的方式,能够快速准确的实现基于目标数据的语义检索和用户的个人喜好推荐。
根据本公开实施例的第一个方面,提供了一种基于语义理解的智能检索系统,包括:
配置单元,其用于对检索参数进行配置,生成检索模板;
语义检索单元,其用于基于所述检索模板中的参数,采用语义特征提取方法对待检索信息进行语义特征提取;基于提取的语义特征以及相似度计算方法,从所述检索模板绑定的数据集中获取第一检索结果;
关键词检索单元,其用于从待检索信息中进行关键词提取,基于提取的关键词从所述检索模板绑定的数据集中获取第二检索结果;
检索结果获取单元,其用于基于所述检索模板中的排序方式,将所述第一检索结果与第二检索结果进行合并排序,获得检索结果。
进一步的,所述语义检索单元,采用BERT算法对数据集中的样本进行语义特征提取,并基于Milvus中内置的特征提取算法对待检索信息进行语义特征提取,并基于语义特征向量内积方法计算待检索信息与数据集中样本间的相似度,基于所述相似度结果以及预设阈值获得检索结果。
进一步的,所述关键词检索单元,预先对带检索信息进行分词,并基于关键词提取算法从分词结果中获取待检索的关键词;同时,通过判断数据集样本中是否存在所述关键词,获得检索结果。
进一步的,所述将所述第一检索结果与第二检索结果进行合并排序,具体为:筛除所述第一检索结果与第二检索结果中的重复检索结果,并根据所述检索模板中预先配置的排序方式及排序字段进行检索结果排序。
进一步的,所述检索模板的配置包括:模板名称、绑定数据集、请求参数、返回参数以及排序方式的配置。
进一步的,所述排序方式包括但不限于属性排序和相关度排序,其中,所述属性排序包括升序和降序,且所述属性配排序需要预先确定排序字段。
根据本公开实施例的第二个方面,提供了一种基于语义理解的智能检索方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东亿云信息技术有限公司,未经山东亿云信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111575120.0/2.html,转载请声明来源钻瓜专利网。