[发明专利]数据处理方法和系统有效
申请号: | 201710406139.X | 申请日: | 2017-06-01 |
公开(公告)号: | CN107256244B | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 李萧萧;郝晖;邵荣防;谢群群;薛儒璇;陈贱辉;徐雷洋 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 任岩 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 系统 | ||
1.一种数据处理方法,包括:
获取至少一个用户在第一时间段内的搜索信息,所述搜索信息包括多个搜索词以及所述搜索词对应的搜索时间;
将所述多个搜索词中属于相同用户的任意两个不同的搜索词按照相同的搜索时间顺序组成至少一个搜索词对;以及
计算所述至少一个搜索词对中的每个搜索词对的关联分,得到至少一个第一分值,所述第一分值与对应的搜索词对的两个搜索词对应的所述搜索时间的时间间隔长度相关,所述第一分值与所述时间间隔长度成反比;当属于同一用户的相同搜索词对对应有多个第一分值时,多个第一分值对应的时间间隔长度不同,从多个第一分值中选择与最小时间间隔长度对应的第一分值作为该搜索词对的第一分值;针对属于同一个用户的多个搜索词对,每个搜索词对的第一分值与该搜索词对对应的时间间隔长度成反比;
其中,所述至少一个搜索词对中的每个搜索词对由两个搜索词按照搜索时间顺序构成,
针对所述每个搜索词对,所述两个搜索词包括相关搜索词和另一个搜索词,所述相关搜索词的搜索时间先于所述另一个搜索词的搜索时间,
针对用户发出的搜索请求中的相关搜索词,所述搜索请求中的相关搜索词用于作为向所述用户推荐另一搜索词的依据,以使得所推荐的另一搜索词与所述搜索请求中的相关搜索词属于同一搜索词对。
2.根据权利要求1所述的方法,还包括:
将所述至少一个搜索词对中相同的搜索词对对应的至少一个第一分值进行累加,得到第二分值。
3.根据权利要求2所述的方法,其中,所述将所述至少一个搜索词对中相同的搜索词对对应的至少一个第一分值进行累加,包括:
将属于相同用户的相同的搜索词对中所述时间间隔在满足预设条件下最短的搜索词对对应的关联分作为所述用户的所述搜索词对的第一分值;
将属于不同用户的所述相同的搜索词对的所述第一分值进行累加,得到第二分值。
4.根据权利要求2所述的方法,还包括:
确定所述第二分值对应的搜索词对在第二时间段内的关联分,得到第三分值;
将所述第三分值与所述第二分值累加,得到第四分值。
5.根据权利要求4所述的方法,其中,所述将所述第三分值与所述第二分值累加包括加权累加,所述第三分值的系数小于所述第二分值的系数。
6.根据权利要求4或5所述的方法,还包括:
存储所述第四分值以及所述第四分值对应的搜索词对;和/或
根据所述至少一个搜索词对,以及所述搜索词对对应的第四分值建立查询表。
7.根据权利要求6所述的方法,还包括:
获取用户搜索请求,所述搜索请求包括与用户搜索相关的相关搜索词;
查询所述至少一个搜索词对中包含有所述相关搜索词的关联搜索词对,其中,所述关联搜索词对包括所述相关搜索词的搜索时间在先;以及
根据所述关联搜索词对对应的第四分值的大小,将所述关联搜索词对中非所述相关搜索词的搜索词按顺序返回给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710406139.X/1.html,转载请声明来源钻瓜专利网。