[发明专利]点击模型生成方法和装置有效
申请号: | 201410560304.3 | 申请日: | 2014-10-20 |
公开(公告)号: | CN105512156B | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 蒋雷 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 11240 北京康信知识产权代理有限责任公司 | 代理人: | 李志刚;吴贵明 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 点击 模型 生成 方法 装置 | ||
本发明公开了一种点击模型生成方法和装置。其中,方法包括:分别获取预先划分的多个地理区域的用户的历史点击信息,得到对应于多个地理区域的多个历史点击信息集合;计算多个历史点击信息集合之间的历史点击信息的重叠率;利用多个历史点击信息集合之间的历史点击信息的重叠率来对多个地理区域进行聚类,得到多个区域类;以及分别生成对应于多个区域类的点击模型,得到多个点击模型,多个点击模型与多个区域类一一对应。通过本发明,解决了现有技术中通过运行点击模型得到的搜索结果不能准确地预测用户的点击行为的技术问题,达到了基于不同地理区域的点击模型准确地预测用户的点击行为的效果。
技术领域
本发明涉及搜索引擎领域,具体而言,涉及一种点击模型生成方法和装置。
背景技术
在互联网领域中,对于提供搜索服务的网站而言,搜索引擎系统能够根据用户输入的检索词来预测用户的点击行为。而这个过程中,点击模型起到了至关重要的作用。点击模型是对用户点击行为的建模,根据用户的历史点击信息,对用户的信物和行为进行建模,以对用户未来的点击行为进行预测,提高相关性。
然而,发明人发现,由于使用互联网的用户存在地域差异,不同地域的用户的历史点击行为也具有差异性,而现有搜索引擎中通常是利用用户行为来训练得到一个点击模型,这样,导致通过运行点击模型得到的搜索结果不能准确地预测用户的点击行为。
针对现有技术中通过运行点击模型得到的搜索结果不能准确地预测用户的点击行为的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种点击模型生成方法和装置,以解决现有技术中通过运行点击模型得到的搜索结果不能准确地预测用户的点击行为的技术问题。
根据本发明实施例的一个方面,提供了一种点击模型生成方法,包括:分别获取预先划分的多个地理区域的用户的历史点击信息,得到对应于多个地理区域的多个历史点击信息集合;计算多个历史点击信息集合之间的历史点击信息的重叠率,重叠率用于表示多个历史点击信息集合之间具有相同点击行为的比例;利用多个历史点击信息集合之间的历史点击信息的重叠率来对多个地理区域进行聚类,得到多个区域类,其中,多个区域类中的每一个区域类包括一个或者多个地理区域;以及分别生成对应于多个区域类的点击模型,得到多个点击模型,多个点击模型与多个区域类一一对应。
根据本发明实施例的另一方面,还提供了一种点击模型生成装置,包括:第一获取单元,用于分别获取预先划分的多个地理区域的用户的历史点击信息,得到对应于多个地理区域的多个历史点击信息集合;计算单元,用于计算多个历史点击信息集合之间的历史点击信息的重叠率,重叠率用于表示所述多个历史点击信息集合之间具有相同点击行为的比例;聚类单元,用于利用所述多个历史点击信息集合之间的历史点击信息的重叠率来对所述多个地理区域进行聚类,得到多个区域类,其中,所述多个区域类中的每一个区域类包括一个或者多个地理区域;以及生成单元,用于分别生成对应于所述多个区域类的点击模型,得到多个点击模型,所述多个点击模型与所述多个区域类一一对应。
根据本发明实施例,通过按照预先划分的多个地理区域对历史点击信息进行分类,得到对应于多个地理区域的多个历史点击信息集合,并利用多个历史点击信息集合之间的历史点击信息的重叠率来对多个地理区域进行聚类,得到多个区域类,分别生成对应于多个区域类的点击模型,得到多个点击模型,其中,每个区域类对应一个点击模型,通过建立的点击模型,可以按照地域差异性来预测用户的点击行为,从而可以根据用户的位置信息准确地预测用户的点击行为,解决了现有技术中通过运行点击模型得到的搜索结果不能准确地预测用户的点击行为的技术问题,达到了基于不同地理区域的点击模型准确地预测用户的点击行为的效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的点击模型生成方法的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410560304.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于手势的雷达拼图显示优化方法
- 下一篇:一种基于本体的动态语义检索方法