[发明专利]网络搜索行为识别方法及其系统有效
申请号: | 201210164201.6 | 申请日: | 2012-05-24 |
公开(公告)号: | CN103425696A | 公开(公告)日: | 2013-12-04 |
发明(设计)人: | 谢慧琦 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 王茹;黄晓庆 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 搜索 行为 识别 方法 及其 系统 | ||
技术领域
本发明涉及网络搜索的技术领域,特别是涉及一种网络搜索行为识别方法,以及一种网络搜索行为识别系统。
背景技术
在通常的网络搜索技术中,用户搜索行为是指用户通过搜索获取自己感兴趣的内容的行为;主动搜索是指用户主动在搜索表单中输入关键词,而获取搜索结果的行为;而非主动搜索即为用户不输入关键词,而直接访问他人预先设好的包含某个关键词的搜索URL(UniformResourceLocator,统一资源定位符),来获取搜索结果的行为。
根据以上对主动搜索的定义可以看出,例如,用户在搜索文本框中输入关键词,然后点击“搜索”按钮的行为是主动搜索;而不输入关键词,直接点击网页上由网站预先筛选好并推荐展示的热门关键词,进入搜索页获取搜索结果的行为,则不是主动搜索。因为文本输入框下方的关键词是搜索网页通过人工或者算法推荐出来的关键词,属于预设的关键词,不是用户主动输入的。
以目前QQ网购平台识别主动搜索的方式为例,其操作流程如下:
1.用户在搜索输入框输入关键词,然后点击搜索按钮。
2.用户的搜索表单提交到QQ网购的搜索CGI(Common Gateway Interface,公共网关接口),并会附上查询参数KeyWord(关键字)=用户输入的关键词,另外带上查询参数as=1。比如用户搜索iphone,则提交到搜索CGI的URL可能是:http://searchex.buy.qq.com/html?KeyWord=iphone&as=1。其中,查询参数as=1是标记本次搜索是否是主动搜索的一个参数,若as参数的值为1,则表明是主动搜索,否则不是主动搜索。
在搜索CGI获取用户给定关键词的搜索结果并以HTML方式返回搜索结果给用户。
返回给用户侧的搜索结果对本次搜索进行上报,若发现URL的查询参数as等于1,则上报为主动搜索,否则上报为非主动搜索。
然而,通过上述方法识别用户的主动搜索行为会有以下的缺点:
当用户通过主动搜索后获得搜索URL后,再传送给别人,比如通过邮件或者即时消息发送给他人,他人点击该搜索URL的操作同样会被说明是主动搜索,因为此操作中的搜索URL的as参数会等于1。
网站运营通过主动搜索得到搜索URL后,把该搜索URL预先埋好在网站的页面里面,作为关键词推荐,而一旦用户点击这些关键词,触发该搜索URL,则同样会被说明是主动搜索。
综上所述,上述用户的搜索行为识别方法并不可靠,存在多种非主动搜索被误识别为主动搜索的情形。事实上,通过对某些用户搜索上报数据的研究发现,很多明显是网站的运营预先在页面设好的推荐关键词触发的搜索,占据了主动搜索词排行榜的大部分。
发明内容
针对背景技术中存在的上述问题,本发明的目的在于提供一种网络搜索行为识别方法,能够准确地识别用户的主动搜索和非主动搜索。
一种网络搜索行为识别方法,包括以下步骤:
接收输入关键字并触发搜索的指令,生成搜索请求,并在所述搜索请求中添加用户标识;
接收根据所述搜索请求返回的搜索结果,比较所述搜索结果中包含的用户标识和接收所述搜索结果的用户的用户标识是否一致;
如果所述用户标识不一致,则将本次搜索识别为非主动搜索。
针对背景技术中存在的上述问题,本发明的目的还在于提供一种能够准确地识别用户的主动搜索和非主动搜索的网络搜索行为识别系统。
一种网络搜索行为识别系统,包括:
搜索请求生成模块,用于接收输入关键字并触发搜索的指令,生成搜索请求,并在所述搜索请求中添加用户标识;
用户标识判断模块,用于接收根据所述搜索请求返回的搜索结果,比较所述搜索结果中包含的用户标识和接收所述搜索结果的用户的用户标识是否一致;
以及,搜索行为识别模块,用于在用户标识不一致时,将本次搜索识别为非主动搜索。
与现有技术相比较,本发明的网络搜索行为识别方法及其系统,通过在搜索URL中添加用户标识,对比接收到搜索结果的用户的用户标识,准确地识别用户的主动搜索和非主动搜索行为。在所述用户标识不相同,识别为非主动搜索。若用户复制其主动搜索的搜索URL并传播给他人,则他人点击该搜索URL后,由于用户标识不一致,则同样识别为非主动搜索;同理,若网站运营预先在页面上设置好的关键词链接被访客点击后,也会因为用户标识不一致被识别为非主动搜索。解决了对主动搜索的标记和识别问题,更加可靠,并且做到开发代价的最低化,保证对用户主动搜索上报的准确性和稳定性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210164201.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种结构改良型音箱
- 下一篇:通过网线同时传输电源和视频信号的模拟摄像机