[发明专利]基于用户特征的预测社交网络信息流行度的方法及系统有效
| 申请号: | 201410472689.8 | 申请日: | 2014-09-16 |
| 公开(公告)号: | CN104281882B | 公开(公告)日: | 2017-09-15 |
| 发明(设计)人: | 李歌;胡玥;于延宇;李丹 | 申请(专利权)人: | 中国科学院信息工程研究所 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q10/04;G06Q50/00 |
| 代理公司: | 北京路浩知识产权代理有限公司11002 | 代理人: | 李相雨 |
| 地址: | 100093 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 用户 特征 预测 社交 网络 信息 流行 方法 系统 | ||
1.一种基于用户特征的预测社交网络信息流行度的方法,其特征在于,该方法包括:
获取预设时间内社交网络中的信息数据和与所述信息数据对应的用户数据,所述用户数据包括多个用户属性特征;
从所述用户数据中提取影响信息传播的有效的用户属性特征,以及根据所述用户数据,获取所述用户数据的用户行为特征;
按照提取的用户属性特征和所述用户行为特征将用户数据进行分类,得到用户数据中用户的类别;
根据所述信息数据以及所述用户数据中用户的类别,获取与所述信息数据对应的用户传播特征;
根据所述用户传播特征,确定社交网络信息流行度的预测模型;
采用所述预测模型对一段时间内产生的信息数据进行分析,对信息流行度进行预测;
所述根据所述信息数据以及所述用户数据中用户的类别,获取与所述信息数据对应的用户传播特征,包括:
按照用户的类别,将数据库中的信息数据中参与信息传播的用户按照用户的类别进行统计,统计的各个类别的用户数量作为所述信息数据对应的用户传播特征;
所述根据所述用户传播特征,确定社交网络信息流行度的预测模型,包括:
建立基于用户特征的多元线性模型;
将所述用户传播特征作为训练集,对所述线性模型进行训练,得到社交网络信息流行度预测模型;
其中,所述用户特征由提取的用户属性特征和所述用户行为特征进行归一化处理得到。
2.根据权利要求1所述的方法,其特征在于,所述获取预设时间内社交网络中的信息数据和与所述信息数据对应的用户数据步骤后,该方法还包括:
将所述用户数据和所述信息数据存储到数据库中。
3.根据权利要求1所述的方法,其特征在于,所述获取预设时间内社交网络中的信息数据和与所述信息数据对应的用户数据,包括:
采用网络爬虫获取论坛类社交网络的用户数据和信息数据;
采用应用程序编程接口API获取微博类社交网络的用户数据和信息数据;
采用网络爬虫获取社区类社交网络的用户数据,采用用户的剪贴板获取社区类社交网络的信息数据。
4.根据权利要求1所述的方法,其特征在于,所述按照提取的用户属性特征和所述用户行为特征将用户数据进行分类,得到用户数据中用户的类别,包括:
对提取的用户属性特征和所述用户行为特征进行归一化处理,得到用户特征;
根据所述用户特征,采用聚类算法将用户数据进行分类,得到用户数据中用户的类别。
5.根据权利要求4所述的方法,其特征在于,所述采用聚类算法将用户数据进行分类,包括:
将用户数据分为两类,并计算类别中心的距离,若类别中心的距离小于预设值,则将这两个类别融合成一个类别;
对各类别的用户数据继续分类,并计算各类别中心的距离,直至出现三个类别的用户数据融合成一个类别时停止分类,得到用户的类别。
6.一种基于用户特征的预测社交网络信息流行度的系统,其特征在于,该系统包括:
获取模块,用于获取预设时间内社交网络中的信息数据和与所述信息数据对应的用户数据,所述用户数据包括多个用户属性特征;
特征提取模块,用于从所述用户数据中提取影响信息传播的有效的用户属性特征,以及根据所述用户数据,获取所述用户数据的用户行为特征;
分类模块,用于按照提取的用户属性特征和所述用户行为特征将用户数据进行分类,得到用户数据中用户的类别;
处理模块,用于根据所述信息数据以及所述用户数据中用户的类别,获取与所述信息数据对应的用户传播特征;
预测模型模块,用于根据所述用户传播特征,确定社交网络信息流行度的预测模型;
预测模块,用于采用所述预测模型对一段时间内产生的信息数据进行分析,对信息流行度进行预测;
所述处理模块,具体用于:
按照用户的类别,将数据库中的信息数据中参与信息传播的用户按照用户的类别进行统计,统计的各个类别的用户数量作为所述信息数据对应的用户传播特征;
所述预测模型模块包括:
建立模型子模块,用于建立基于用户特征的多元线性模型;
训练子模块,用于将所述用户传播特征作为训练集,对所述线性模型进行训练,得到社交网络信息流行度预测模型;
其中,所述用户特征由提取的用户属性特征和所述用户行为特征进行归一化处理得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410472689.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于订单排产的印刷系统
- 下一篇:羧基丁腈橡胶粒子在修补胶中的应用





