[发明专利]一种网页推荐方法和装置有效
申请号: | 201210080831.5 | 申请日: | 2012-03-23 |
公开(公告)号: | CN103324645B | 公开(公告)日: | 2018-10-09 |
发明(设计)人: | 王犇;何军;杨志峰 | 申请(专利权)人: | 深圳市世纪光速信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网页 推荐 方法 装置 | ||
1.一种网页推荐的方法,其特征在于,该方法包括:
获取点击查询日志,所述点击查询日志包括用户ID、关键词、以及网页ID;
汇总每个用户ID的关键词,建立该用户ID的兴趣模型;汇总所有用户ID的网页ID,获取每个网页ID对应的网页中的关键词,建立该网页ID的兴趣模型;根据用户ID的兴趣模型和网页ID的兴趣模型确定用户ID和网页ID的关联度;其中,所述汇总所有用户ID的网页ID,获取每个网页ID对应的网页中的关键词,建立该网页ID的兴趣模型包括:对该网页ID对应的网页的内容进行分词,去除无效词,统计剩余的每个关键词在该网页中的出现次数,根据该关键词的出现次数确定该网页ID对该关键词的兴趣度;所述汇总每个用户ID的关键词,建立该用户ID的兴趣模型包括:汇总该用户ID对应的用户查询过的所有关键词,统计该用户查询每个关键词时点击网页ID的个数,根据点击网页ID的个数确定该用户ID对该关键词的兴趣度;
当接收到用户的点击搜索结果命令进入无线网页搜索转码页时,按照和用户ID的关联度从高到低的顺序选择第一预设个数的网页ID,将选择的每个网页ID对应的网页在该转码页中进行推荐。
2.根据权利要求1所述的网页推荐方法,其特征在于,
所述用户ID的兴趣模型包括第一兴趣项,所述第一兴趣项包括多个第一兴趣子项,所述第一兴趣子项包括关键词、用户ID对关键词的兴趣度;
所述网页ID的兴趣模型包括第二兴趣项,所述第二兴趣项包括多个第二兴趣子项,所述第二兴趣子项包括关键词、网页ID对关键词的兴趣度。
3.根据权利要求2所述的网页推荐方法,其特征在于,
所述根据用户ID的兴趣模型和网页ID的兴趣模型确定用户ID和网页ID的关联度包括:
根据每个用户ID的兴趣模型中用户ID对各个关键词的兴趣度生成N维向量VK1;
根据每个网页ID的兴趣模型中网页ID对各个关键词的兴趣度生成N维向量VK2;
计算N维向量VK1和VK2间的距离DK,将DK记为该用户ID和该网页ID间的关联度。
4.根据权利要求2所述的网页推荐方法,其特征在于,
所述用户ID的兴趣模型包括第三兴趣项,所述第三兴趣项包括多个第三兴趣子项,所述第一兴趣子项包括关键词类型、用户ID对关键词类型的兴趣度;
所述汇总每个用户ID的关键词,建立该用户ID的兴趣模型包括:汇总该用户ID对应的用户查询过的所有关键词并确定每个关键词所属类型;统计该用户查询每类关键词时点击网页ID的个数,根据点击网页ID的个数确定该用户ID对该类关键词的兴趣度;
所述网页ID的兴趣模型包括第四兴趣项,所述第四兴趣项包括多个第四兴趣子项,所述第四兴趣子项包括关键词类型、网页ID对关键词类型的兴趣度;
所述汇总所有用户ID的网页ID,获取每个网页ID对应的网页中的关键词,建立该网页ID的兴趣模型包括:对该网页ID对应的网页的内容进行分词,去除无效词,确定剩余每个关键词所属类型,统计每类关键词在该网页中的出现次数,根据该类关键词的出现次数确定该网页ID对该类关键词的兴趣度。
5.根据权利要求4所述的网页推荐方法,其特征在于,
所述根据用户ID的兴趣模型和网页ID的兴趣模型确定用户ID和网页ID的关联度包括:
根据每个用户ID的兴趣模型中用户ID对各类关键词的兴趣度生成N维向量VC1;
根据每个网页ID的兴趣模型中网页ID对各类关键词的兴趣度生成N维向量VC2;
计算N维向量VC1和VC2间的距离DC,将DC记为该用户ID和该网页ID间的关联度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市世纪光速信息技术有限公司,未经深圳市世纪光速信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210080831.5/1.html,转载请声明来源钻瓜专利网。