[发明专利]一种基于用户意图识别的搜索方法以及装置在审
| 申请号: | 202010101815.4 | 申请日: | 2020-02-19 |
| 公开(公告)号: | CN111400436A | 公开(公告)日: | 2020-07-10 |
| 发明(设计)人: | 武振杰 | 申请(专利权)人: | 北京值得买科技股份有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/9532;G06F16/9535;G06F40/289 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100160 北京市丰台区汽车博物*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 用户 意图 识别 搜索 方法 以及 装置 | ||
本公开是关于一种基于用户意图识别的搜索方法、装置、电子设备以及存储介质,涉及计算机技术领域。该方法包括:根据预处理分析,按照预设分类规则进行搜索关键词分类,得到分类后的多个词性类别的第一分类信息;对所述多个词性类别的第一分类信息结构化处理后得到结构化数据,并将所述结构化数据发布至分词器;接收用户输入的搜索信息,将所述搜索信息与分词器中结构化数据进行匹配,并进行词性分析,以确定所述搜索信息是否满足预设组合条件;当所述搜索信息满足预设组合条件时,调整对满足预设组合条件的搜索信息的权重。本公开可以快速验证添加的分词的效果,无需等待集群重启完毕,节约运维成本,无需依赖外部服务,可以实现系统的快速的部署。
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种基于用户意图识别的搜索方法、装置、电子设备以及计算机可读存储介质。
背景技术
随着互联网的发展,web的信息从数量上呈现了爆炸式的增长,搜索引擎的出现在一定的程度上解决了针对海量信息检索和浏览的问题。在依赖关键词进行检索的搜索引擎框架中,经常无法返回满足用户意图的相关结果。这一方面是因为Web上的信息量非常巨大,另一方面是用户提交的查询意图通常非常短,所包含的信息量很少。
现有实现搜索意图的技术一般是通过在Elasticsearch之外,将用户提交的关键词构建简单的DSL语句去匹配Elasticsearch中索引的结构化字段。
上述方式中,直接将用户的提交的关键词提交给Elasticsearch,并不知道用户的真实想要的数据,把关键词匹配到的数据完全反馈给用户。用户点击的欲望会降低,减少了二次交互的可能。
因此,需要提供一种至少能够解决上述问题的技术方案。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种基于用户意图识别的搜索方法、装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
根据本公开的一个方面,提供一种基于用户意图识别的搜索方法,包括:
第一分类信息生成步骤,根据预处理分析,按照预设分类规则进行搜索关键词分类,得到分类后的多个词性类别的第一分类信息;
结构化数据生成步骤,对所述多个词性类别的第一分类信息结构化处理后得到结构化数据,并将所述结构化数据发布至分词器;
数据搜索步骤,接收用户输入的搜索信息,将所述搜索信息与分词器中结构化数据进行匹配,并进行词性分析,以确定所述搜索信息是否满足预设组合条件;
权重调整步骤,当所述搜索信息满足预设组合条件时,调整对满足预设组合条件的搜索信息的权重。
在本公开的一种示例性实施例中,所述多个词性类别包括品类、品牌、商城,所述按照预设分类规则进行搜索关键词分类,包括:
抓取互联网公开的品类、品牌、商城名称数据,并审核分类;
获取人工提交的品类、品牌、商城名称数据,并审核分类。
在本公开的一种示例性实施例中,所述多个词性类别包括品类、品牌、商城,将所述搜索信息与分词器中结构化数据进行匹配后,所述方法还包括:
若所述搜索信息与分词器中结构化数据匹配失败,分析匹配失败的搜索信息的词性,并根据分析结果对所述搜索信息进行分类。
在本公开的一种示例性实施例中,所述方法还包括:
建立各个词性类别与基础库数据的对应关系,并配置对应的权重值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京值得买科技股份有限公司,未经北京值得买科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010101815.4/2.html,转载请声明来源钻瓜专利网。





