[发明专利]一种基于多信息源图嵌入的好友推荐方法及系统在审
| 申请号: | 201910450218.X | 申请日: | 2019-05-28 |
| 公开(公告)号: | CN110134881A | 公开(公告)日: | 2019-08-16 |
| 发明(设计)人: | 张邦佐;李瑞雪;孙小新;冯国忠 | 申请(专利权)人: | 东北师范大学 |
| 主分类号: | G06F16/9536 | 分类号: | G06F16/9536 |
| 代理公司: | 北京卓特专利代理事务所(普通合伙) 11572 | 代理人: | 陈变花 |
| 地址: | 130117 吉林省长春市净月*** | 国省代码: | 吉林;22 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 嵌入 目标节点信息 好友推荐 结构向量 属性向量 向量 多信息源 嵌入的 拼接 源节点信息 节点信息 目标节点 获取源 源节点 技术效果 输出节点 准确度 隐藏层 概率 推送 申请 送入 学习 | ||
本申请公开了一种基于多信息源图嵌入的好友推荐方法及系统,其中,基于多信息源图嵌入的好友推荐方法包括:获取源节点信息和目标节点信息;分别对源节点信息和目标节点信息进行图嵌入处理,并获取源节点信息的嵌入后结构向量和嵌入后属性向量,以及目标节点信息的嵌入后结构向量和嵌入后属性向量;拼接源节点信息的嵌入后的结构向量和嵌入后的属性向量获得完整的源节点向量;拼接目标节点信息的嵌入后的结构向量和嵌入后的属性向量获得完整的目标节点向量;将完整的源节点向量和完整的目标节点向量进行拼接后送入隐藏层进行学习;完成学习后,输出节点之间存在的连接的概率并根据概率的大小进行推送。本申请具有提高好友推荐准确度的技术效果。
技术领域
本申请涉及信息技术领域,尤其涉及一种基于多信息源图嵌入的好友推荐方法及系统。
背景技术
社交网络是社会中每个成员之间沟通交流产生关系从而形成的网络,我们熟悉了解的社交网络有微信、新浪微博、知乎等等,在这些社交网络平台上用户可以发表自己的一些新奇想法,也可以给他人的想法点赞或者评论从而产生互动,并通过这些互动可以结交到新朋友。社交网络中一个节点表示一位用户,节点通过关系连接起来从而形成一个规模巨大的网络。传统的,通过链接预测观察到的边以及节点的属性来预测两个节点间存在一条边的可能性,若两个节点间存在一条边就表示两个用户存在好友关系,两个节点之间不存在边则表示不存在好友关系或者关系未知。为了得到两个用户之间确切的关系,在有关社交网络的链接预测研究中,如何准确的表示网络信息是一个重要问题。传统的网络表示一般使用高维的稀疏向量,但高维的稀疏向量需要花费更多的运行时间和计算空间,是人们使用统计学习方法时的局限所在。此外,节点还包含丰富的属性信息,比如用户的性别、年龄、学校、星座、位置信息等等。在社交网络的互动中,年龄比较相近的用户更可能成为好友,在同一所学校的两个用户也比不在一个学校更容易成为好友。另外,用户的兴趣爱好也是好友推荐的一个重要因素。当前的一些社交网站虽然也专门设置了好友推荐模块,但该好友推荐模块通常采用协同过滤,即通过用户-用户关系矩阵分析用户之间的相似度,根据相似度大小为用户推荐新的朋友。但在实际生活中,用户-用户交互矩阵中含有大量的缺失值,而且当新用户加入社交网络时无法得到交互信息,容易造成数据稀疏、新用户冷启动等问题。传统的好友推荐模块多只是利用数据信息的结构信息计算两个用户的相似性,而将节点中存在的丰富的属性信息忽略了。如何将这些结构信息和属性信息充分利用起来,分析出用户的偏好,了解到用户更喜欢和哪种类型的人交往,更喜欢购买什么样的物品,增加推荐结果的准确性和提高用户的满意度也是当前需要解决的问题。
发明内容
本申请的目的在于提供一种基于多信息源图嵌入的好友推荐方法及系统,具有利用属性信息和图嵌入算法提高了好友推荐的准确度的技术效果。
为达到上述目的,本申请提供一种基于多信息源图嵌入的好友推荐方法,包括如下步骤:获取源节点信息和目标节点信息;分别对源节点信息和目标节点信息进行图嵌入处理,并获取源节点信息的嵌入后结构向量和嵌入后属性向量,以及目标节点信息的嵌入后结构向量和嵌入后属性向量;拼接源节点信息的嵌入后的结构向量和嵌入后的属性向量获得完整的源节点向量;拼接目标节点信息的嵌入后的结构向量和嵌入后的属性向量获得完整的目标节点向量;将完整的源节点向量和完整的目标节点向量进行拼接后,送入隐藏层进行学习;完成学习后,输出节点之间存在的连接的概率,并根据概率的大小进行推送。
优选的,源节点信息包括源节点结构信息和源节点属性信息;目标节点信息包括目标节点结构信息和目标节点属性信息。
优选的,源节点结构信息采用独热编码的形式转换为一组二进制的结构输入向量输入。
优选的,源节点属性信息为离散属性或连续属性;离散属性采用独热编码的形式转换为一组二进制的属性输入向量输入,连续属性通过词频-逆向文件频率转换为实值向量输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北师范大学,未经东北师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910450218.X/2.html,转载请声明来源钻瓜专利网。





