[发明专利]基于标签匹配的搜索方法、系统、计算机设备及存储介质在审
申请号: | 202210251580.6 | 申请日: | 2022-03-15 |
公开(公告)号: | CN114461761A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 苏丹丹;唐婉;梁燕子;吴寒怡 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/335;G06F16/338 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 饶文彬 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 标签 匹配 搜索 方法 系统 计算机 设备 存储 介质 | ||
本发明公开了一种基于标签匹配的搜索方法、系统、计算机设备及存储介质,其中,所述基于标签匹配的搜索方法包括:接收查询信息;对所述查询信息进行语义提取,并根据提取到的语义信息确定对应的查询问题;根据所述查询问题从预设的政策标签体系中确定查询标签;基于所述查询标签从政策数据库中选取匹配率大于预设阈值的政策文本作为目标文本;将所述目标文本推送给用户。本发明实施例的有益效果在于:通过对查询信息进行语句提取,以匹配对应的查询问题,再根据查询问题确定查询标签,进而查询出对应的目标文本,提高了信息查询的准确性。
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种基于标签匹配的搜索方法、系统、计算机设备及存储介质。
背景技术
政策文章不同于其他文本内容,使用的词汇及句法有其固有特点,在生活中并不常见。非政府人员或非相关研究员在搜索查找政策时,往往使用更加生化话的用词及句式来描述自己所需,如果使用传统的模糊匹配方式直接搜索,不但很难找到目标政策,往往还会出现大量的错误政策召回,给政策搜寻带来较大困难。
发明内容
有鉴于此,本发明实施例的目的是提供一种基于标签匹配的搜索方法、系统、计算机设备及存储介质,用以解决政策文本搜索准确率低的问题。
为实现上述目的,本发明实施例提供了一种基于标签匹配的搜索方法,所述方法包括:
接收查询信息;
对所述查询信息进行语义提取,并根据提取到的语义信息确定对应的查询问题;
根据所述查询问题从预设的政策标签体系中确定查询标签;
基于所述查询标签从政策数据库中选取匹配率大于预设阈值的政策文本作为目标文本;
将所述目标文本推送给用户。
进一步地,所述接收查询信息,包括:
接收所述用户的查询请求,并基于所述查询请求展示查询页面,所述查询页面包括多个政策问题;
通过所述查询页面接收所述用户从多个政策问题中选定的所述查询信息或者用户在所述查询页面输入的所述查询信息。
进一步地,所述对所述查询信息进行语义提取,并根据提取到的语义信息确定对应的查询问题,包括:
获取多个政策问题;
对所述查询信息进行语义提取,得到语义信息;
分别计算所述语义信息与所述多个政策问题的匹配率,并将匹配率最高的政策问题作为所述查询问题。
进一步地,所述对所述查询信息进行语义提取,并根据提取到的语义信息确定对应的查询问题之前,所述方法还包括:
获取预设范围内的政策数据,所述政策数据中包括多个政策文本;
收集所述预设范围内的用户集群对于所述政策数据的多个调研报告;
基于所述多个调研报告确定多个政策问题。
进一步地,所述根据所述查询问题从预设的政策标签体系中确定查询标签之前,包括:
基于所述政策数据与所述多个调研报告建立政策标签体系,其中,所述政策标签体系包括多个类别的标签,每个类别的标签包括多层级标签,所述政策标签体系中的最低层级标签与所述多个政策问题对应。
进一步地,所述根据所述查询问题从预设的政策标签体系中确定查询标签,包括:
根据所述查询问题从预设的政策标签体系中查询与所述查询问题对应的目标标签;
将目标标签对应的类别标签作为查询标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210251580.6/2.html,转载请声明来源钻瓜专利网。