[发明专利]数据处理方法和系统有效
申请号: | 201710406139.X | 申请日: | 2017-06-01 |
公开(公告)号: | CN107256244B | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 李萧萧;郝晖;邵荣防;谢群群;薛儒璇;陈贱辉;徐雷洋 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 任岩 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 系统 | ||
本公开提供了一种数据处理方法,包括:获取至少一个用户在第一时间段内的搜索信息,所述搜索信息包括多个搜索词以及所述搜索词对应的搜索时间;将所述多个搜索词中属于相同用户的任意两个不同的搜索词按照相同的搜索时间顺序组成至少一个搜索词对;以及计算所述至少一个搜索词对中的每个搜索词对的关联分,得到至少一个第一分值,所述第一分值与对应的搜索词对的两个搜索词对应的所述搜索时间的时间间隔相关。
技术领域
本公开涉及互联网技术领域,更具体地,涉及一种数据处理方法和系统。
背景技术
随着互联网技术的快速发展,通过网络平台进行信息搜索或者交易等活动以其低成本、高效率的优势获得了越来越多的用户青睐。用户在使用网络平台进行信息搜索的过程中,经常会出现误输入、或者搜索结果无法满足用户的搜索目的、或者用户想要连续搜索多个相关信息等情况,在这种情况下,用户则需要重新进行输入,增加了用户的工作量,降低了用户的体验感。
此时,服务提供商希望为用户提供更加个性化的服务,在展示相关的搜索结果时,也理解用户的搜索意图,为其推荐相关的搜索词,减少用户再次输入的工作量,吸引用户地进一步搜索。
然而,在实现本发明构思的过程中,发明人发现现有技术中至少存在如下问题,在确定两个搜索词的关联度时,通常使用语义分析的方法,该种方法对用户输入的搜索词要求严格,如果用户存在误输入的情况则会导致误判,并且不能为用户提供语义上没有关联,但是经常被用户一起搜索的词语。
发明内容
有鉴于此,本公开提供了一种更加准确的确定搜索词之间关联度的数据处理方法和系统。
本公开的一个方面提供了一种数据处理方法,包括:获取至少一个用户在第一时间段内的搜索信息,所述搜索信息包括多个搜索词以及所述搜索词对应的搜索时间,将所述多个搜索词中属于相同用户的任意两个不同的搜索词按照相同的搜索时间顺序组成至少一个搜索词对,以及计算所述至少一个搜索词对中的每个搜索词对的关联分,得到至少一个第一分值,所述第一分值与对应的搜索词对的两个搜索词对应的所述搜索时间的时间间隔相关。
根据本公开实施例,上述方法还包括:将所述至少一个搜索词对中相同的搜索词对对应的至少一个第一分值进行累加,得到第二分值。
根据本公开实施例,所述将所述至少一个搜索词对中相同的搜索词对对应的至少一个第一分值进行累加,包括:将属于相同用户的相同的搜索词对中所述时间间隔在满足预设条件下最短的搜索词对对应的关联分作为所述用户的所述搜索词对的第一分值,以及将属于不同用户的所述相同的搜索词对的所述第一分值进行累加,得到第二分值。
根据本公开实施例,上述方法还包括:确定所述第二分值对应的搜索词对在第二时间段内的关联分,得到第三分值,以及将所述第三分值与所述第二分值累加,得到第四分值。
根据本公开实施例,所述将所述第三分值与所述第二分值累加包括加权累加,所述第三分值的系数小于所述第二分值的系数。
根据本公开实施例,上述方法还包括:存储所述第四分值以及所述第四分值对应的搜索词对,和/或根据所述至少一个搜索词对,以及所述搜索词对对应的第四分值建立查询表。
根据本公开实施例,上述方法还包括:获取用户搜索请求,所述搜索请求包括与用户搜索相关的相关搜索词,查询所述至少一个搜索词对中包含有所述相关搜索词的关联搜索词对,其中,所述关联搜索词对包括所述相关搜索词的搜索时间在先,以及根据所述关联搜索词对对应的第四分值的大小,将所述关联搜索词对中非所述相关搜索词的搜索词按顺序返回给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710406139.X/2.html,转载请声明来源钻瓜专利网。