[发明专利]一种基于因子图模型的社交网络多任务预测方法在审
申请号: | 201710770816.6 | 申请日: | 2017-08-31 |
公开(公告)号: | CN107451703A | 公开(公告)日: | 2017-12-08 |
发明(设计)人: | 张子柯;林松;刘闯 | 申请(专利权)人: | 杭州师范大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q30/02;G06Q30/06;G06Q50/00;G06F17/30 |
代理公司: | 杭州天正专利事务所有限公司33201 | 代理人: | 王兵,黄美娟 |
地址: | 311121 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 因子 模型 社交 网络 任务 预测 方法 | ||
技术领域
本发明涉及机器学习方法,因子图模型,个性化推荐技术和网络迁移结构 构建技术,适用于解决异质网络中多任务链接预测问题。
背景技术
随着互联网技术的进步和在线社交网络的普及,网络规模不断扩大,人们 所面临的网络也从简单的人际关系网络向耦合社交网络过渡。耦合社交网络通 常具有复杂的网络结构,包含多类型的节点(比如用户和商品)和多种类型的 边(比如社交链接和评分链接)。传统的耦合社交网络中的链路预测研究主要集 中在社交链路预测或者评分链路预测,通常认为不同类型的链路预测任务之间 是相互独立的。然而在真实世界中的网络,这两种预测往往是相关的,比如, 如果两个人是朋友则他们更有可能购买或评价相同的商品,同样的,如果两个 人经常购买或评价同样的商品,则他们更有可能具有相似的兴趣和爱好,而有 更大概率成为朋友。因此,如何通过构建网络迁移结构,结合因子图模型,使 多种预测任务通过信息流动产生关联,对复杂网络中的异质链路预测研究有着 极重要的理论和实际意义。
现有链路预测思路是先计算网络节点特征,比如入度、出度、聚类系数等; 网络拓扑结构特征,比如共同邻居指标、AA指标、Salton指标、Jaccard指标、 HPI指标等,然后把多种特征集成在一起公式中r代表集成的结果, xi代表提取的第i个特征,wi代表第i个特征的权重,最后带入到已有的机器学 习模型中,通过训练得到权重向量w。
然而,由于社交链路预测和评分链路预测网络结构的不同,提取的特征也不同, 因此需要学习多个模型。现在的因子图模型在链路预测技术的应用时认为社交 网络中多种预测任务之间的是独立的,做多种预测需要训练不同的模型,目前 还没有通过挖掘网络迁移结构来做多任务的链路预测。
现有的预测技术没有解决数据稀疏性问题,没有充分利用网络的结构信息, 不能适应多任务的链路预测;
多任务预测需要学习多个机器学习模型,计算效率低下;没有充分考虑到 多种预测任务之间的耦合促进作用。
发明内容
本发明要克服现有技术的上述缺点,提供一种基于因子图模型的社交网络 多任务预测方法。
本发明是一种基于因子图模型的社交网络多任务预测方法,其流程图如图1 所示。本方法利用传统的复杂网络中链路预测方法作为特征,通过构建网络迁 移结构,使多种预测任务之间发生信息流动,相互耦合,解决了数据稀疏性、 计算效率低下的问题,同时提高预测结果的准确性,该方法包括以下几个步骤。
第一步,网络数据获取:通过网络爬虫收集用户社交信息和行为信息,并 对爬取的数据进行清理,方便后续计算,主要包括网络数据爬取和数据预处理。
(1)网络数据爬取:爬取用户社交行为信息和用户对商品的行为信息,每条 信息包括:用户UserID和用户UserID,用户UserID和商品ItemID。
(2)数据预处理:为了方便后续计算,需要清理数据中冗余、不完整的数据, 形成模型所需要的统一的用户和用户社交行为矩阵w1,用户和商品评分行为矩 阵w2。在矩阵w1中,矩阵中元素w1ij表示用户i和用户j之间的好友、关注等关 系(可以是单向也可以是双向),在矩阵w2中,矩阵中元素w2ij表示用户i和商 品j之间的收藏、购买、评价等关系。
第二步,建立多任务因子图模型:
(1)网络特征提取:因子图模型是一个监督学习模型,我们需要利用网络中 的异构信息为社交链接和评分链接提取特征。在社交网络中对于一个特定的节 点i,我们可以提取节点特征,包括度k(vi),出度kout(vi),入度kin(vi),聚类 系数ci。对于社交网络节点对i和j,相似性指标是预测其在网络中是否连接的 最相关的特征。因此,我们提取了一些传统的相似性指标作为特征。
交叉网络(用户和商品的评分关系)也隐藏着社交网络节点对的信息,比 如他们共同评论的商品越多,则他们是朋友的可能性越大。基于此,我们根据 交叉网络提取一些相似性指标。类似的,对于交叉网络目标节点对用户i和商品 a,我们也可以根据相似性指标来提取特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州师范大学,未经杭州师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710770816.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:可旋转定位工装夹具
- 下一篇:一种数控机床辅助机械夹具
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理