[发明专利]一种信息推送方法及设备有效
| 申请号: | 201010246774.4 | 申请日: | 2010-08-03 |
| 公开(公告)号: | CN102346751A | 公开(公告)日: | 2012-02-08 |
| 发明(设计)人: | 张旭;顾海杰;祁建程;苏宁军 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
| 地址: | 英属开曼群岛大开曼*** | 国省代码: | 开曼群岛;KY |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 信息 推送 方法 设备 | ||
技术领域
本申请涉及计算机技术领域,尤其涉及一种信息推送方法及设备。
背景技术
协同过滤(Collaborative Filtering)技术作为信息过滤的主要技术之一,被广泛应用于计算机技术下的多种领域的个性化服务系统中。基于条目比较的协同过滤算法(后续简称为Itembased算法)是协同过滤算法之一,Itembased算法认为用户更倾向于获知与其已操作(如浏览、购买item中的商品)过的条目(item)相似或相关的其他item,因此,将item视为由用户对该item的操作行为构成的向量,从系统提供的数据中搜索与目标item相关的邻居item集合,并将所述邻居item集合中各item的信息推送给用户,使用户在浏览目标item时,可以根据推送的信息方便地浏览邻居item;上述目标item是指某一用户已操作过的条目,上述邻居item是指与该目标item相似或相关的其他item。
例如:目标item是A品牌手机,在一段时间内浏览过目标item对应页面的用户包括:用户_1、用户_2和用户_3。通过对系统中所有item与目标item之间的关联比较,得出如下结果:
查找出邻居item_1是B品牌手机,在一段时间内浏览过邻居item_1对应页面的用户包括:用户_1、用户_2和用户_4,则表示既浏览过目标item对应页面又浏览过邻居item_1对应页面的用户数量为2;
查找出邻居item_2是C品牌手机,在一段时间内浏览过邻居item_2对应页面的用户包括:用户_1、用户_2、用户_3和用户_4,则表示既浏览过目标item对应页面又浏览过邻居item_2对应页面的用户数量为3。
如果上述结果表明邻居item_1和邻居item_2与目标item之间的相似度已经满足需求,则可以将邻居item_1和邻居item_2的信息推送给用户,用户在浏览目标item对应的页面时,可以方便地浏览邻居item_1和邻居item_2对应的页面,使用户获得实际需求的有用信息。
在目前的Itembased算法中,如果系统内item的数量为M,则最高需要进行M2次item之间的相似度计算,由于Itembased算法的运算量非常大,导致运算时间长,且无论是否有用的item都要进行相似度运算,导致运算噪音大,运算结果准确性较低;另外,由于进行M2次item之间的相似度计算后产生的数据文件过大,需要占用较大的存储空间,并且过大的数据文件为后续的搜索过程带来运算压力。
发明内容
本申请实施例的目的在于,提供一种信息推送方法及设备,用以解决现有技术中存在的Itembased算法的运算量大和运算噪音大的问题。
一种信息推送方法,所述方法包括:
依次读取待处理条目item,针对读取的每个item分别执行:
判断对读取的待处理item和目标item都进行操作的用户数量是否达到门限值;
若未达到门限值,则丢弃所述待处理item;否则,确定所述待处理item与目标item之间的相似度;
在待处理item都读取完后,将与目标item之间的相似度由高到低的N个待处理item的信息推送给用户,所述N为正整数。
一种信息推送设备,所述设备包括:
读取模块,用于依次读取待处理条目item,并针对读取的每个item触发第一判断模块;
第一判断模块,用于判断对读取的待处理item和目标item都进行操作的用户数量是否达到门限值;
丢弃模块,用于在未达到门限值时,丢弃所述待处理item;
相似度确定模块,用于在达到门限值时,确定所述待处理item与目标item之间的相似度;
推送模块,用于在待处理item都读取完后,将与目标item之间的相似度由高到低的N个待处理item的信息推送给用户,所述N为正整数。
本申请在进行相似度计算时先丢弃明显无法满足目标门限值的待处理item,只对与目标item进行操作的相同用户的用户数量达到门限值的待处理item进行相似度运算,大大减少了运算量,提高运算效率;将与目标item的相似度明显较低的待处理item删除,能够降低运算噪音,提高运算结果的准确性;同时,由于减少了运算量,运算后得到的数据文件较小,因此,减少了数据文件占用的存储空间,也提高了后续搜索过程的效率。
附图说明
图1为本申请的网络架构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010246774.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:食用菌菇根剪
- 下一篇:结构改良的含过滤器的末端风口
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





