[发明专利]搜索排序方法、装置、计算机设备和存储介质有效
| 申请号: | 201810848395.9 | 申请日: | 2018-07-27 |
| 公开(公告)号: | CN108959644B | 公开(公告)日: | 2020-04-14 |
| 发明(设计)人: | 彭钊 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/338 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 搜索 排序 方法 装置 计算机 设备 存储 介质 | ||
1.一种搜索排序方法,其特征在于,所述方法包括:
获取搜索关键词,确定与多个所述搜索关键词匹配的多个初始检索结果;其中,所述初始检索结果包括联系人、群或消息;所述初始检索结果的字段中包括对象类型、对象状态、对象名称、初始召回搜索引擎分数、聊天更新时间、最近一条消息位置、对象拼音名、对象英文名、所在部门中的至少一种信息;所述对象类型包括聊天应用和/或邮件;所述对象状态包括是否注册和/或是否离职;
根据所述初始检索结果,提取文本相似度、更新时间维度和联系人客观重要度;其中,所述文本相似度用于表征所述搜索关键词与搜索结果匹配程度,所述更新时间维度用于表征搜索结果聊天记录更新情况,所述联系人客观重要度用于表征公众对所述搜索结果的评价高低;所述联系人客观重要度由公众评价数据确定;
根据文本相似度、更新时间维度和联系人客观重要度,获取对应的文本相似度权重、更新时间维度权重和联系人客观重要度权重;
根据所述文本相似度权重、更新时间维度权重和联系人客观重要度权重对每个所述初始检索结果进行融合计算,得到每个所述初始检索结果的综合权值;
根据所述综合权值对所述多个初始检索结果进行排序;
其中,所述根据所述文本相似度权重、更新时间维度权重和联系人客观重要度权重进行融合计算,得到每个所述初始检索结果的综合权值包括:
根据所述文本相似度权重、更新时间维度权重和联系人客观重要度权重分别获取偏移值和修正值;
分别计算文本相似度权重、更新时间维度权重和联系人客观重要度权重与与其对应的所述偏移值之积再与与其对应的所述修正值之和得到融合系数;
将所述融合系数相乘,得到每个所述初始检索结果的综合权值;
其中,所述偏移值和修正值由机器学习确定;所述偏移值和所述修正值用于表示重要程度;
其中,在提取每个所述初始检索结果相关的文本相似度、更新时间维度和联系人客观重要度之前,包括:
对所述初始检索结果进行筛选,包括:
对离职用户且无聊天记录的初始检索结果不进行排序;
将未注册用户的初始检索结果排在最后。
2.根据权利要求1所述的方法,其特征在于,所述获取文本相似度权重包括:
计算所述关键词在所述初始检索结果中的命中率、顺序一致性指标、位置紧密度和覆盖率;
根据所述命中率、顺序一致性指标、位置紧密度和覆盖率,计算文本相似度权重。
3.根据权利要求2所述的方法,其特征在于,所述根据所述命中率、顺序一致性指标、位置紧密度和覆盖率计算文本相似度权重的步骤包括:
根据所述命中率、顺序一致性指标、位置紧密度和覆盖率分别获取偏移值和修正值;
根据所述命中率、顺序一致性指标、位置紧密度和覆盖率和对应的所述偏移值和修正值进行融合计算,得到文本相似度权重。
4.根据权利要求1所述的方法,其特征在于,所述获取更新时间维度权重包括:
根据所述初始检索结果,获取最后一次聊天时间距离当前时间的时间间隔;
计算衰减常数与所述时间间隔与所述衰减常数之和的比值,得到所述更新时间维度权重。
5.根据权利要求1所述的方法,其特征在于,所述获取联系人客观重要度权重包括:
获取所述搜索结果职位级别、发表文章数目比值、受关注数据和点赞数据;
根据所述职位级别、发表文章数目比值、受关注数据和点赞数据,计算联系人客观重要度权重。
6.根据权利要求5所述的方法,其特征在于,所述根据所述职位级别、发表文章数目比值、受关注数据和点赞数据,计算联系人客观重要度权重包括:
根据所述职位级别、发表文章数目比值、受关注数据和点赞数据分别获取偏移值和修正值;
根据所述职位级别、发表文章数目比值、受关注数据和点赞数据和对应的所述偏移值和修正值进行融合计算,得到联系人客观重要度权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810848395.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:生成标签的方法、装置、服务器和存储介质
- 下一篇:一种政策法规收集分析系统





