[发明专利]用户查询上下位关系提取的方法、装置、电子设备和介质有效
| 申请号: | 201710260844.3 | 申请日: | 2017-04-20 |
| 公开(公告)号: | CN108733702B | 公开(公告)日: | 2020-09-29 |
| 发明(设计)人: | 张俊浩;江雪;徐夙龙 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35 |
| 代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;赵静 |
| 地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用户 查询 下位 关系 提取 方法 装置 电子设备 介质 | ||
1.一种用户查询上下位关系提取的方法,其特征在于,包括:
构造候选用户查询对;
利用预先根据观察指标设置的特征,将所述候选用户查询对表示为特征向量;
在对所述候选用户查询对中预设数量的用户查询对进行人工标注之后,利用监督学习训练分类器;
利用训练好的分类器判断所述候选用户查询对中剩余的用户查询对是否符合上下位关系,输出符合上下位关系的用户查询对作为提取结果;
其中,所述观察指标包括以下一种或几种:
观察指标一:上位用户查询展示的自然结果数大于下位用户查询展示的自然结果数;
观察指标二:上位用户查询展示的自然结果集合包含下位用户查询展示的自然结果集合的程度,大于下位用户查询展示的自然结果集合包含上位用户查询展示的自然结果集合的程度;
观察指标三:上位用户查询与下位用户查询展示的自然结果集合重叠数量越大,上位用户查询展示的自然结果集合包含关系置信度越高;
观察指标四:上位用户查询点击的自然结果数大于下位用户查询点击的自然结果数;
观察指标五:上位用户查询点击的自然结果集合包含下位用户查询点击的自然结果集合的程度,大于下位用户查询点击的自然结果集合包含上位用户查询点击的自然结果集合的程度;
观察指标六:上位用户查询与下位用户查询点击的自然结果集合的重叠数量越大,上位用户查询点击的自然结果集合包含关系置信度越高。
2.根据权利要求1所述的方法,其特征在于,构造候选用户查询对包括:
对用户查询进行聚类;
然后将类内用户查询两两组合,构成候选用户查询对。
3.根据权利要求2所述的方法,其特征在于,对用户查询进行聚类包括:
根据用户的Session数据构建图,其中,以用户查询作为图的节点,然后对在窗口内的共现次数超过预设阈值的用户查询节点进行连接作为图的边,边权为以下四个值的乘积:用户查询共现次数、用户查询进行切词后词汇集合的相似度、用户查询的embedding向量相似度、用户查询点击的自然结果集合的相似度;以及
利用标签传播算法对图上的用户查询节点进行聚类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710260844.3/1.html,转载请声明来源钻瓜专利网。





