[发明专利]基于用户特征的预测社交网络信息流行度的方法及系统有效
| 申请号: | 201410472689.8 | 申请日: | 2014-09-16 |
| 公开(公告)号: | CN104281882B | 公开(公告)日: | 2017-09-15 |
| 发明(设计)人: | 李歌;胡玥;于延宇;李丹 | 申请(专利权)人: | 中国科学院信息工程研究所 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q10/04;G06Q50/00 |
| 代理公司: | 北京路浩知识产权代理有限公司11002 | 代理人: | 李相雨 |
| 地址: | 100093 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 用户 特征 预测 社交 网络 信息 流行 方法 系统 | ||
技术领域
本发明涉及网络安全技术领域,具体涉及基于用户特征的预测社交网络信息流行度的方法及系统。
背景技术
目前,网络已经成为获取信息的重要途径,尤其是随着各种社交网站的快速崛起,更方便的信息获取和更快速的信息传播随之而来。社交网络已经形成了庞大的线上社会群体,构建了密切的线上人际关系。社交网络上的信息传播不同于信件、口头、报纸等传统的信息传播,社交网络中的信息传播具有以下几方面的突出特征,第一,具有很强的实时性,科技的进步,信息的发出者很容易将看到的重大事件用最快的时间向外传播;第二,拥有较强的群体性,社交网络的信息发布变得随心所欲,不同的人出于一些目的会发布一些具有煽动性的信息,而这些信息广泛传播将会引发群体性。第三,信息更新周期性变小,由于信息的大量发布,信息的来源越来越广,所以信息在传播中逐渐被新的信息所取代,周期性变小。
信息传播的流行度预测结合社交网络上信息传播的特点,会有效的解决很多问题。能够及早的发现信息传播中的变化,尽早的对信息传播的流行度做出预测成为了信息实时推送和社会网络舆情监测的主要部分。目前,对信息推送和舆情传播都是采用的监测方法,设置一个阀值,当信息的某些参数大于这个阀值时,就会定义为推送信息或者舆情信息。这些方法相对粗糙,信息的实时特征很难得到保证。
发明内容
针对现有技术的缺陷,本发明提供的基于用户特征的预测社交网络信息流行度的方法,结合用户行为特征的特点,更加准确地预测社交网络的信息传播,解决热点发现滞后、信息推送以及网络舆情监测实时性难以保证的问题。
第一方面,本发明提供了一种基于用户特征的预测社交网络信息流行度的方法,该方法包括:
获取预设时间内社交网络中的信息数据和与所述信息数据对应的用户数据,所述用户数据包括多个用户属性特征;
从所述用户数据中提取部分用户属性特征,以及根据所述用户数据,获取所述用户数据的用户行为特征;
按照所述用户属性特征和所述用户行为特征将用户数据进行分类,得到用户数据中用户的类别;
根据所述信息数据以及所述用户数据中用户的类别,获取与所述信息数据对应的用户传播特征;
根据所述用户传播特征,确定社交网络信息流行度的预测模型;
采用所述预测模型对一段时间内产生的信息数据进行分析,对信息流行度进行预测。
优选地,所述获取预设时间内社交网络中的信息数据和与所述信息数据对应的用户数据步骤后,该方法还包括:
将所述用户数据和所述信息数据存储到数据库中。
优选地,所述获取预设时间内社交网络中的信息数据和与所述信息数据对应的用户数据,包括:
采用网络爬虫获取论坛类社交网络的用户数据和信息数据;
采用应用程序编程接口API获取微博类社交网络的用户数据和信息数据;
采用网络爬虫获取社区类社交网络的用户数据,采用用户的剪贴板获取社区类社交网络的信息数据。
优选地,所述按照所述用户属性特征和所述用户行为特征将用户数据进行分类,得到用户数据中用户的类别,包括:
对所述用户属性特征和所述用户行为特征进行归一化处理,得到用户特征;
根据所述用户特征,采用聚类算法将用户数据进行分类,得到用户数据中用户的类别。
优选地,所述采用聚类算法将用户数据进行分类,包括:
将用户数据分为两类,并计算类别中心的距离,若类别中心的距离小于预设值,则将这两个类别融合成一个类别;
对各类别的用户数据继续分类,并计算各类别中心的距离,直至出现三个类别的用户数据融合成一个类别时停止分类,得到用户的类别。
优选地,所述根据所述用户传播特征,确定社交网络信息流行度的预测模型,包括:
建立基于用户特征的多元线性模型;
将所述用户传播信息作为训练集,对所述线性模型进行训练,得到社交网络信息流行度预测模型。
第二方面,本发明提供了一种基于用户特征的预测社交网络信息流行度的系统,该系统包括:
获取模块,用于获取预设时间内社交网络中的信息数据和与所述信息数据对应的用户数据,所述用户数据包括多个用户属性特征;
特征提取模块,用于从所述用户数据中提取部分的用户属性特征,以及根据所述用户数据,获取所述用户数据的用户行为特征;
分类模块,用于按照所述用户属性特征和所述用户行为特征将用户数据进行分类,得到用户数据中用户的类别;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410472689.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于订单排产的印刷系统
- 下一篇:羧基丁腈橡胶粒子在修补胶中的应用





