[发明专利]一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法在审
| 申请号: | 201510973710.7 | 申请日: | 2015-12-23 |
| 公开(公告)号: | CN105574183A | 公开(公告)日: | 2016-05-11 |
| 发明(设计)人: | 刘海亮;宋聪颖;黄鹏 | 申请(专利权)人: | 中山大学深圳研究院 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 协同 过滤 推荐 算法 近邻 分类 app 方法 | ||
技术领域
本发明涉及一种基于协同过滤推荐算法与K最近邻分类算法相结合的App推荐方法,是属 于移动互联网应用领域。
背景技术
随着技术的发展,智能电视、智能机顶盒、智能手机等智能化产品越来越受到消费者的 青睐。相应的,应用商店中的软件也如雨后春笋般快速地增长。如何将优质的应用通过排名 准确地呈现给智能化产品的用户,让用户花费最少的成本及时间选择到适合自己的优质应用, 成为维持应用商店健康发展的重点。第三方软件公司经常采用恶意下载方式,以此提升该应 用排名。因此,需要改进应用排名方式,防止粗制软件占据榜单,以使得更好地保障应用商 店的健康发展。
传统的应用商店按照“发布时间”、“排名上升速度”、“评分高低”、“评论次数”、 “下载次数”、“检索次数”、“激活量”、“卸载次数”等属性分发应用。
在传统应用商店的分发模式下,70%的下载量都被0.1%的Top热门应用所占据,而99.9%不 常使用的低频应用仅仅占到了总下载量的30%,即便有很好的工具、很好的服务,却没有好的 方法触及自己的目标客户,居于不利位置。应用商店的展现形式是优先展示下载量最大的Top 热门应用,形成强者恒强的局面,如果要搜索,前提是必须要知道这个应用的名字,很多需 求无法有效对接给开发者。
并且,在传统应用商店分发模式下,第三方软件公司经常采用恶意下载方式,以此提升 该应用排名。
最后,附近的人往往是相同的群体,其行为习惯也大体相同。但自己身边周围的人常用 的一些应用常常因为排名靠后而不能被发现,互联网的长尾效应无法得到释放,没有很好的 实现app的智能检索排序。
当前的应用商店按照传统分类方式将应用分类,未充分考虑用户之间的关系。因而需要 设计适合的推荐算法来提高app搜索时的搜索效率。
发明内容
本发明的目的在于提供一种基于协同过滤推荐算法与K最近邻分类算法的App推荐方法, 主要用于解决基于模型推荐算法的传统应用商店不能很好的解决用户喜好变化以及不能很好 解决冷门App的推荐问题,从而提高App推荐的精度。
为解决上述的技术问题,本发明采用的方案如下:
第一步,采集用户注册信息,包括年龄、爱好、账号等信息;
第二步,采集用户移动设备上安装的App名称信息并且上传到后台服务器;在用户装载 或卸载移动设备上的App时,其在后台服务器上对应的App名称信息也相应地添加或删除;
第三步,采用基于协同过滤的推荐算法,根据用户安装的App信息,找出与该用户兴趣 相似度较大的集合M;将集合M中的用户所有App信息存储到集合N中;统计集合N中各个App 出现的次数,按照次数多少的顺序返回给用户;
采用基于协同过滤推荐算法分类的具体过程如下:
第一步,根据用户兴趣,采用KNN算法,分为M个集合。其中,用户的兴趣来自用户安 装的App信息以及用户注册时填写的兴趣;
第二步,将M个集合中的每个集合内的所有App信息存储到集合N中;统计集合N中各个 App出现的次数,按照次数多少的顺序返回给用户;
其中,第一步中从安装的App得出用户兴趣的过称为:统计各款App的所属分类。第一步 中KNN算法过程如下:
1.维护一个大小为k的的按距离由大到小的优先级队列,用于存储最近邻训练元组。随 机从训练元组中选取k个用户作为初始的最近邻元组,分别计算测试元组到这k个元组的距离, 设用户Ui与用户Uj兴趣相似度为Dj,则该距离计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学深圳研究院,未经中山大学深圳研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510973710.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信息存储方法及装置
- 下一篇:一种数据分析方法及分析系统





