[发明专利]基于语意识别的搜索结果排序方法及相关装置有效
| 申请号: | 201910878030.5 | 申请日: | 2019-09-17 |
| 公开(公告)号: | CN110717008B | 公开(公告)日: | 2023-10-10 |
| 发明(设计)人: | 钱柏丞 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33;G06F40/30;G06F40/289 |
| 代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 孙强 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 语意 识别 搜索 结果 排序 方法 相关 装置 | ||
1.一种基于语意识别的搜索结果排序方法,其特征在于,包括:
获取用户输入的问题信息;
将所述问题信息输入预设的语意识别模型,获取由所述语意识别模型输出的所述问题信息对应的语意信息;
在预存的数据库中匹配与所述问题信息语意相同的近似问题信息集合;
获取所述问题信息对应的搜索结果列表与所述近似问题信息集合中每个近似问题信息对应的搜索结果列表;
针对所述搜索结果列表中每个搜索结果,获取所述每个搜索结果对应的撰写时间、撰写者标识、历史访问信息及历史用户访问该搜索结果后的行为操作信息;
基于所述撰写时间确定第一分数、基于所述撰写者标识确定第二分数、基于所述历史访问信息确定第三分数、基于所述用户访问所述搜索结果后的行为操作信息确定第四分数;
基于所述第一分数、第二分数、第三分数、第四分数,确定所述搜索结果的综合评分;
基于所述搜索结果的综合评分,对所述搜索结果进行排序。
2.根据权利要求1所述的基于语意识别的搜索结果排序方法,其特征在于,所述语意识别模型通过以下方式进行训练:
预先设置问题信息集合;
预先识别出所述问题信息结合中每个问题信息样本对应的语意信息;
将所述问题信息样本输入所述语意识别模型,获取由所述语意识别模型输出的所述问题信息样本对应的语意信息,将所述语意识别模型输出的语意信息与预先识别出的所述问题信息样本对应的语意信息进行比对,如不一致则,调整所述语意识别模型的参数,直至所述语意识别模型输出的语意信息与预先识别出的所述问题信息样本对应的语意信息比对一致。
3.根据权利要求1所述的基于语意识别的搜索结果排序方法,其特征在于,所述获取所述问题信息及所述近似问题信息集合中每个近似问题信息对应的搜索结果列表,包括:
提取所述问题信息对应的关键词与所述近似问题信息对应的关键词;
基于所述问题信息的关键词在预存的网络数据库中确定所述问题信息对应的搜索结果列表;
基于所述近似问题信息对应的关键词在预存的网络数据库中确定所述近似问题信息对应的搜索结果列表。
4.根据权利要求1所述的基于语意识别的搜索结果排序方法,其特征在于,所述基于所述撰写时间确定第一分数,包括:
确定所述撰写时间距当前时间的长度;
根据以下公式确定第一分数:S1=a1/(b1+T1),其中所述S1是第一分数,T1是所述撰写时间距离当前时间的长度,a1和b1是预设的常数。
5.根据权利要求1所述的基于语意识别的搜索结果排序方法,其特征在于,所述基于所述撰写者标识确定第二分数,包括:
基于所述撰写者标识在预存的用户信息库数据库,确定所述撰写者标识对应的撰写者信息,其中所述撰写者信息包含所述撰写者对应的撰写者等级;
根据以下公式确定第二分数:S2=a2·R·D1,其中S2是所述第二分数,D1是所述撰写者等级,a2是预设的正常数,R是预设的大于1的常数。
6.根据权利要求1所述的基于语意识别的搜索结果排序方法,其特征在于,所述基于所述历史访问信息确定第三分数,包括:
提取所述历史访问信息中包含的历史访问次数与历史访问总时长;
根据以下公式确定第三分数:S3=a3·C+a4·lnP其中S3是所述第三分数,C是所述历史访问次数,a3、a4是预设常数、P是所述历史访问总时长。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910878030.5/1.html,转载请声明来源钻瓜专利网。





