[发明专利]一种基于因子图模型的社交网络多任务预测方法在审

申请号：	201710770816.6	申请日：	2017-08-31
公开（公告）号：	CN107451703A	公开（公告）日：	2017-12-08
发明（设计）人：	张子柯;林松;刘闯	申请（专利权）人：	杭州师范大学
主分类号：	G06Q10/04	分类号：	G06Q10/04;G06Q10/06;G06Q30/02;G06Q30/06;G06Q50/00;G06F17/30
代理公司：	杭州天正专利事务所有限公司33201	代理人：	王兵,黄美娟
地址：	311121 浙江省杭州***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于因子模型社交网络任务预测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及机器学习方法，因子图模型，个性化推荐技术和网络迁移结构构建技术，适用于解决异质网络中多任务链接预测问题。

背景技术

随着互联网技术的进步和在线社交网络的普及，网络规模不断扩大，人们所面临的网络也从简单的人际关系网络向耦合社交网络过渡。耦合社交网络通常具有复杂的网络结构，包含多类型的节点(比如用户和商品)和多种类型的边(比如社交链接和评分链接)。传统的耦合社交网络中的链路预测研究主要集中在社交链路预测或者评分链路预测，通常认为不同类型的链路预测任务之间是相互独立的。然而在真实世界中的网络，这两种预测往往是相关的，比如，如果两个人是朋友则他们更有可能购买或评价相同的商品，同样的，如果两个人经常购买或评价同样的商品，则他们更有可能具有相似的兴趣和爱好，而有更大概率成为朋友。因此，如何通过构建网络迁移结构，结合因子图模型，使多种预测任务通过信息流动产生关联，对复杂网络中的异质链路预测研究有着极重要的理论和实际意义。

现有链路预测思路是先计算网络节点特征，比如入度、出度、聚类系数等；网络拓扑结构特征，比如共同邻居指标、AA指标、Salton指标、Jaccard指标、 HPI指标等，然后把多种特征集成在一起公式中r代表集成的结果， x_i代表提取的第i个特征，w_i代表第i个特征的权重，最后带入到已有的机器学习模型中，通过训练得到权重向量w。

然而，由于社交链路预测和评分链路预测网络结构的不同，提取的特征也不同，因此需要学习多个模型。现在的因子图模型在链路预测技术的应用时认为社交网络中多种预测任务之间的是独立的，做多种预测需要训练不同的模型，目前还没有通过挖掘网络迁移结构来做多任务的链路预测。

现有的预测技术没有解决数据稀疏性问题，没有充分利用网络的结构信息，不能适应多任务的链路预测；

多任务预测需要学习多个机器学习模型，计算效率低下；没有充分考虑到多种预测任务之间的耦合促进作用。

发明内容

本发明要克服现有技术的上述缺点，提供一种基于因子图模型的社交网络多任务预测方法。

本发明是一种基于因子图模型的社交网络多任务预测方法，其流程图如图1 所示。本方法利用传统的复杂网络中链路预测方法作为特征，通过构建网络迁移结构，使多种预测任务之间发生信息流动，相互耦合，解决了数据稀疏性、计算效率低下的问题，同时提高预测结果的准确性，该方法包括以下几个步骤。

第一步，网络数据获取：通过网络爬虫收集用户社交信息和行为信息，并对爬取的数据进行清理，方便后续计算，主要包括网络数据爬取和数据预处理。

(1)网络数据爬取：爬取用户社交行为信息和用户对商品的行为信息，每条信息包括：用户UserID和用户UserID，用户UserID和商品ItemID。

(2)数据预处理：为了方便后续计算，需要清理数据中冗余、不完整的数据，形成模型所需要的统一的用户和用户社交行为矩阵w₁，用户和商品评分行为矩阵w₂。在矩阵w₁中，矩阵中元素w₁^ij表示用户i和用户j之间的好友、关注等关系(可以是单向也可以是双向)，在矩阵w₂中，矩阵中元素w₂^ij表示用户i和商品j之间的收藏、购买、评价等关系。

第二步，建立多任务因子图模型：

(1)网络特征提取：因子图模型是一个监督学习模型，我们需要利用网络中的异构信息为社交链接和评分链接提取特征。在社交网络中对于一个特定的节点i，我们可以提取节点特征，包括度k(v_i)，出度k_out(v_i)，入度k_in(v_i)，聚类系数c_i。对于社交网络节点对i和j，相似性指标是预测其在网络中是否连接的最相关的特征。因此，我们提取了一些传统的相似性指标作为特征。

交叉网络(用户和商品的评分关系)也隐藏着社交网络节点对的信息，比如他们共同评论的商品越多，则他们是朋友的可能性越大。基于此，我们根据交叉网络提取一些相似性指标。类似的，对于交叉网络目标节点对用户i和商品 a，我们也可以根据相似性指标来提取特征。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州师范大学，未经杭州师范大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710770816.6/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政；管理
G06Q10-02 .预定，例如用于门票、服务或事件的
G06Q10-04 .预测或优化，例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理，例如组织、规划、调度或分配时间、人员或机器资源；企业规划；组织模型
G06Q10-08 .物流，例如仓储、装货、配送或运输；存货或库存管理，例如订货、采购或平衡订单
G06Q10-10 .办公自动化，例如电子邮件或群件的计算机辅助管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于因子图模型的社交网络多任务预测方法在审

专利文献下载