[发明专利]一种多数据类型分层排序方法和装置有效
申请号: | 202110982158.3 | 申请日: | 2021-08-25 |
公开(公告)号: | CN113792225B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 张晨曦 | 申请(专利权)人: | 北京库睿科技有限公司 |
主分类号: | G06F16/9538 | 分类号: | G06F16/9538;G06F16/33;G06F16/35;G06F16/9532 |
代理公司: | 北京市鼎立东审知识产权代理有限公司 11751 | 代理人: | 陈佳妹 |
地址: | 100012 北京市朝阳区利*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多数 类型 分层 排序 方法 装置 | ||
本申请涉及一种多数据类型分层排序方法和装置,其中方法包括:对接收到的搜索请求进行解析处理和意图识别,得到相应的结构化语义;根据结构化语义得到相应的搜索结果,并由搜索结果中提取出意图类搜索结果,对意图类搜索结果与结构化语义进行语义相似度计算,得到各意图类搜索结果分别与结构化语义的语义相似度评分;根据各意图类搜索结果的语义相似度评分和意图评分,得到各用户意图的最终评分;根据各用户意图的最终评分,对各用户意图进行分层排序,并将各意图类搜索结果对应相应的各用户意图。其能够根据用户意图和结果相关性进行双向判断,返回最全面且相关性强的结果,让用户可以根据意图层级分类快速找到所请求的目标服务或内容。
技术领域
本申请涉及网络数据处理技术领域,尤其涉及一种多数据类型分层排序方法和装置。
背景技术
搜索引擎技术现已广泛应用于各个互联网领域,且以开放搜索、站内搜索等内容型搜索引擎为主。对于不同垂域、不同数据类型搜索结果的排序主要都是基于数据模板区分边界,按照配置信息的分类优先级进行排序。传统的搜索技术,无法准确满足用户在多意图时的精准搜索需求,如:用户在搜索“怒火重案”返回订电影票类结果和视频类结果时,应该哪个类别排序在前,哪个类别排序在后。即,传统的搜索技术很难实现在多意图情况下的搜索结果的排序,从而不能使得输出的搜索结果更加符合用户当前的多意图需求。
发明内容
有鉴于此,本申请提出了一种多数据类型分层排序方法,可以使得输出的搜索结果更加符合用户当前的多意图需求。
根据本申请的一方面,提供了一种多数据类型分层排序方法,包括:
对接收到的搜索请求进行解析处理和意图识别,得到相应的结构化语义;其中,所述结构化语义中包含有识别出的用户意图及对应的意图评分;
根据所述结构化语义得到相应的搜索结果,并由所述搜索结果中提取出意图类搜索结果,对所述意图类搜索结果与所述结构化语义进行语义相似度计算,得到各所述意图类搜索结果分别与所述结构化语义的语义相似度评分;
根据各所述意图类搜索结果的语义相似度评分和所述意图评分,得到各所述用户意图的最终评分;
根据各所述用户意图的最终评分,对各所述用户意图进行分层排序,并将各所述意图类搜索结果对应相应的各所述用户意图。
在一种可能的实现方式中,根据所述结构化语义得到相应的搜索结果,并由所述搜索结果中提取出意图类搜索结果,对所述意图类搜索结果与所述结构化语义进行语义相似度计算时,还包括:
在所述搜索结果中存在有召回的百科类搜索结果时,对所述百科类搜索结果与所述结构化语义进行语义相似度计算。
在一种可能的实现方式中,所述结构化语义中还包括有与所述搜索请求相关的实体词、分词、同义词、纠错词中的至少一种;
其中,对接收到的搜索请求进行解析处理时,包括:
由所述搜索请求中提取出搜索关键词,对所述搜索关键词进行关键词处理得到与所述搜索请求相关系的实体词、分词、同义词、纠错词中的至少一种。
在一种可能的实现方式中,对接收到的所述搜索请求进行意图识别时,通过预先训练的意图识别网络模型进行。
在一种可能的实现方式中,在对所述意图识别网络模型进行训练时,使用的训练样本数据通过爬虫获取;
其中,在通过爬虫获取训练样本数据后,还按照所述训练样本数据所属应用的爬取路径进行意图标注。
在一种可能的实现方式中,根据各所述意图类搜索结果的语义相似度评分和所述意图评分,得到各所述用户意图的最终评分时,通过加权计算的方式进行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京库睿科技有限公司,未经北京库睿科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110982158.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种渣锍全自动剥离装置
- 下一篇:一种融合孪生网络与相关滤波的目标跟踪方法