[发明专利]一种基于复杂网络特性及神经网络聚类挖掘用户兴趣的方法有效
申请号: | 201610056077.X | 申请日: | 2016-01-27 |
公开(公告)号: | CN105740381B | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 张兴兰;刘炀 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 复杂 网络 特性 神经网络 挖掘 用户 兴趣 方法 | ||
本发明涉及一种基于复杂网络特性及神经网络聚类挖掘用户兴趣的方法,主要从以下三方面进行设计,1)构建复杂网络模型,2)确定节点重要性指标,3)神经网络聚类;本方法将复杂网络模型应用到用户软件兴趣的挖掘中,建立用户使用软件的复杂网络,并使用节点的度、聚集系数、节点介数和节点的概率特性指标确定节点的重要性排序,形成用户兴趣集,再利用神经网络模型挖掘兴趣集的聚类,确定用户最终兴趣集,为挖掘用户兴趣模型提供了一种新的方法,并且将用户软件兴趣的挖掘精确性大幅提高,同时这种方法可以对用户的多种兴趣进行挖掘。
技术领域
本发明涉及挖掘用户兴趣的方法,尤其涉及一种基于复杂网络特性及神经网络聚类挖掘用户兴趣的方法,从用户使用软件的行为日志中挖掘用户感兴趣的软件,属于人工智能领域。
背景技术
随着互联网技术的迅猛发展,软件技术作为信息产业的一种,其发展也不可小觑,各种新产品、新应用层出不穷,已经成为生产和生活的重要组成部分。在电子产品如此泛滥的时代,如何抓住用户的兴趣、提高用户对于产品的忠实度和兴趣感,成为提升企业核心竞争力的一个强有力的方案。由于用户使用电子产品(PC或者手机)的过程都是使用各种各样软件的过程,所以对用户使用软件的行为日志进行分析,挖掘用户感兴趣的软件,获取用户的兴趣集,使得产品开发商可以根据获取的用户兴趣集提供个性化的信息服务,开展增值业务,提高产品综合价值。
近年来,机器学习领域吸引了越来越多的关注和研究,随着信息科技的进步、人类行为学的发展,国内外的研究学者已经将用户行为分析挖掘的理论进行了实践研究,并逐步转入商业应用的阶段,取得了良好的成效。大量的研究表明根据用户行为日志挖掘用户兴趣是具有一定研究意义和应用价值的。其中Ford等人采用AprioriAll序列规则挖掘算法对用户访问站点的日志进行研究分析,获取用户的访问兴趣,并根据用户的兴趣设置广告投放,提高了网站的商业价值,但是AprioriAll算法只适用于挖掘用户感兴趣的关联序列,不适用于挖掘用户兴趣的排列顺序。李建廷等人提出了基于用户浏览动作分析用户兴趣度的计算方法,充分考虑了用户访问次数、访问动作、访问速度三种访问模式下的用户兴趣度的计算方式,并利用BP神经网络将这三种模式下的用户兴趣度进行融合,取得了良好的实验效果,这对神经网络算法研究用户兴趣度的融合以及聚类提供了思想,但是BP神经网络对于网络的初始权重十分敏感,不同的初始化值往往会造成不同的训练结果,这很容易造成偏差。王微微等人提出了一种基于用户行为日志挖掘用户兴趣的模型,结合用户的浏览内容和行为模式建立用户兴趣向量,再根据期望最大化的计算方法实现用户聚类,建立最终的用户兴趣模型,该模型虽然可以识别用户的购买兴趣,却没有充分考虑用户行为之间的顺序,即行为的前后序列关系。王梓等人提出了一种基于复合关键词向量空间的方法,最大限度将用户感兴趣的关键词建立关联关系,但其选用的关键词是基于产品属性的,其方法不具有普遍通用性。
复杂网络技术是大数据处理技术的一种,是从复杂性科学角度出发,探索隐藏在大数据中真正的数据价值。复杂网络主要是依靠一切事务都具有相互作用的表现(例如WWW中网页之间的链接关系、文章之间的引用关系和超市中啤酒尿布的关联关系),利用网络的视角建立数据模型,挖掘数据规则,并通过复杂网络的小世界效应和无标度特性计算网络中节点的重要性,形成网络节点的重要性序列。聚类是数据挖掘中的一个重要组成部分,是通过度量样本间的相似性,发现隐藏在底层的关联性数据的又一个常见方法。
为了从用户使用软件的行为日志中获取用户感兴趣的软件,本方法应用复杂网络中的理论知识以及神经网络聚类的方法,先形成用户的兴趣软件集,然后再应用神经网络算法对兴趣软件集中的软件进行聚类,实现这两种方法的结合,计算用户兴趣软件集。首先根据用户行为间的相互作用建立复杂网络模型,将软件看作复杂网络中的节点,按照软件使用的顺序构建边,充分考虑了用户使用软件之间的关联关系。然后根据复杂网络模型的统计指标和行为本身的概率特性,计算网络节点的重要性序列,形成用户兴趣节点社区。最后利用word2vec工具形成软件的向量,根据向量之间的余弦距离衡量软件的相似性,实现用户兴趣社区聚类,合并聚类形成最终的用户感兴趣的软件集合。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610056077.X/2.html,转载请声明来源钻瓜专利网。