[发明专利]利用多源社交网络的合作学习进行用户兴趣分析方法及系统在审
| 申请号: | 201911101644.9 | 申请日: | 2019-11-12 |
| 公开(公告)号: | CN111026943A | 公开(公告)日: | 2020-04-17 |
| 发明(设计)人: | 林俊宇;关惟俐;宋雪萌;甘甜;常晓军;聂礼强 | 申请(专利权)人: | 山东大学 |
| 主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9536 |
| 代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 董雪 |
| 地址: | 266237 山*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 利用 社交 网络 合作 学习 进行 用户 兴趣 分析 方法 系统 | ||
本发明公开了一种利用多源社交网络的合作学习进行用户兴趣分析方法及系统,包括:构建多源用户信息数据集;对于S个信息源,为全部的社交媒体用户定义S个预测模型,所述S个预测模型构成用户兴趣预测模型;将S个预测模型对应的权重矩阵分割成代表多源信息一致性的权重矩阵与代表多源信息互补性的权重矩阵;构建关于权重和置信度的损失函数;对所述用户兴趣预测模型赋予所述损失函数,并进行迭代优化;将待分析的社交用户多信息源输入到优化后的用户兴趣预测模型,输出该社交用户的兴趣爱好分类的预测。本发明充分利用了多源信息互补性,有效的提高了社交用户兴趣预测的准确度。
技术领域
本发明涉及用户兴趣分析技术领域,尤其涉及一种利用多源社交网络的合作学习进行用户兴趣分析方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
随着互联网产业的蓬勃发展,许多关于社交的媒体网站应运而生,人们会在这样的社区分享他们的生活。近年来,有许多研究工作围绕多社交媒体用户行为分析展开。现有的技术主要结合多个社交媒体网络源,以多源信息一致性和多源信息置信度进行分析,来作出用户兴趣推断。如果只利用多源信息一致性和多源信息置信度进行分析,忽略了多社交媒体源之间的互补性,损失了中间关联属性,不能完全表示社交媒体用户特征信息,无法实现精准用户兴趣分析。
传统的多源社交网络模型在进行社交用户分析时只考虑了多源信息一致性与多源信息置信度,忽略了多社交媒体源具有互补性这一重要依据。如何把互补性这一具有优秀表征性质的属性集成到社交分析模型当中是一个具有挑战性的问题;对于一个社交媒体用户来说,他会在多个平台使用不同的用户名信息,如何将这些不对齐信息进行对齐处理是具有较高难度的。
发明内容
为了解决上述问题,本发明提出了一种利用多源社交网络的合作学习进行用户兴趣分析方法及系统,利用多源信息一致性、多源信息互补性、以及多源信息置信度三者的结合来进行社交媒体用户行为分析,使该框架能够进行诸如用户兴趣爱好等推断,进而帮助社交媒体网站对其用户拥有精准行为分析及预测。
在一些实施方式中,采用如下技术方案:
一种利用多源社交网络的合作学习进行用户兴趣分析方法,包括:
构建多源用户信息数据集;
对于S个信息源,为全部的社交媒体用户定义S个预测模型,所述S个预测模型构成用户兴趣预测模型;
将S个预测模型对应的权重矩阵分割成代表多源信息一致性的权重矩阵与代表多源信息互补性的权重矩阵;
根据代表多源信息一致性的权重矩阵、代表多源信息互补性的权重矩阵以及多源信息置信度权重,构建关于权重和置信度的损失函数;
对所述用户兴趣预测模型赋予所述损失函数,并进行迭代优化,直至整个损失函数完全收敛;
将待分析的社交用户多信息源输入到优化后的用户兴趣预测模型,输出该社交用户的兴趣爱好分类的预测。
在另一些实施方式中,采用如下技术方案:
一种利用多源社交网络的合作学习进行用户兴趣分析系统,包括:
用于收集来自于多个社交媒体平台的用户信息,并对所述用户信息进行文本预处理以及文本有效特征的提取,利用提取的特征构建多源用户信息数据集的装置;
用于将S个预测模型对应的权重矩阵分割成代表多源信息一致性的权重矩阵与代表多源信息互补性的权重矩阵的装置;
用于根据代表多源信息一致性的权重矩阵、代表多源信息互补性的权重矩阵以及多源信息置信度权重,构建关于权重和置信度的损失函数的装置;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911101644.9/2.html,转载请声明来源钻瓜专利网。





