[发明专利]社会网络信息传播树生成方法及系统有效
| 申请号: | 201310492999.1 | 申请日: | 2013-10-18 |
| 公开(公告)号: | CN103605661A | 公开(公告)日: | 2014-02-26 |
| 发明(设计)人: | 薛一波;易成岐 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 李相雨 |
| 地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 社会 网络 信息 传播 生成 方法 系统 | ||
技术领域
本发明涉及网络与信息安全技术领域,尤其涉及一种社会网络信息传播树生成方法及系统。
背景技术
社会网络分析技术是信息安全和社会网络领域中的核心技术。其主要任务是以社会网络中的个人、群体、事件等不同维度进行多角度分析。
社会媒体的内部结构称为社会网络。社会网络最初起源于1934年美国社会心理学家Moreno对小群体使用计量学的方法进行的实验研究。哈佛大学的心理学教授Stanley Milgram在1967年创立了六度分割理论,其主要思想是在网络上随机抽取的两个人之间所间隔的人不会超过六个,通过这个理论每一个人物的社交范围都会不断地被放大并形成大型的网络。70年代,社会网络研究逐渐成为一个新兴的社会学专业,近年来社交网络的相关研究也成为计算机科学领域的一个研究热点。
2011年2月,著名的IT风险投资人约翰·杜尔提出一个新兴概念:“SoLoMo”。So(Social,社交);Lo(Local,本地位置);Mo(Mobile,移动)。在此之后,SoLoMo被一致认为是互联网未来发展趋势,SoLoMo的概念风靡全世界。
随着社会网络的发展,截止到2013年1月,Facebook、Twitter、新浪微博和腾讯微博的用户数分别突破了10亿、5亿、4亿和5亿。与此同时,社会网络也产生了大量的用户生成内容(User Generated Content,UGC)信息,这些UGC信息在社会网络上呈病毒式信息扩散,而且传播速度呈指数性增长。
当前社会网络上的信息传播呈现出渠道多样化、传播速度快、规模范围广等现象,给信息的传播分析带来了新的挑战。全球各领域的研究人员开始致力于这方面的研究,试图通过分析信息的传播过程发现在新型社会网络上的信息传播规律。通过对社会网络上信息传播规律研究,既可以应用于信息传播预测、广告精准投放及利益最大化、传播态势感知、个性化推荐等多个领域,也可以从中发现和挖掘不良用户和信息,保障互联网的信息安全。因此,社会网络的信息传播规律研究具有非常重要的学术意义和实用价值。
然而,在信息传播分析领域中,往往分析人员很难获取社会媒体上的真实信息传播数据,现在还没有一种非常有效的社会网络的信息传播树生成方法。
发明内容
(一)要解决的技术问题
本发明所要解决的技术问题是:如何提供一种社会网络的信息传播树生成方法及系统,以快速、有效地对真实社会媒体上的真实信息传播数据进行获取,同时依据树形数据结构保存信息传播链。
(二)技术方案
为解决上述问题,本发明提供一种社会网络信息传播树生成方法,包括步骤:S1.根据源头信息ID或者源头信息URL获取该条信息的所有基本属性;S2.将所述源头信息保存为该条信息传播树的树根节点;S3.根据所述源头信息ID获取根转发列表;S4.将所述根转发列表中的所有信息挂载到所述树根节点,形成第一层转发链;S5.从所述根转发列表中取出第一条信息;S6.根据输入的信息ID获取该条信息的子转发列表,并且将所述子转发列表挂载到输入的信息节点上;S7.将所述子转发列表与所述根转发列表进行对比;S8.判断所述子转发列表与所述根转发列表是否含有重复项,若不含有,则从所述根转发列表取出下一条信息,并返回步骤S6,若含有,则执行步骤S9;S9.依据含有的重复项搜索所述树根节点的所有挂载点,将重复的挂载点进行剪枝;S10.从所述子转发列表中取出下一条信息,并返回步骤S6。
优选地,所述所有基本属性包括:发表信息的用户ID、用户昵称、信息ID、信息内容、信息发表时间、信息转发量。
优选地,所述基本属性的获取方法是指通过解析社会网络的基本信息页面结构,分析并获取输入信息的所有属性。
优选地,所述树形数据结构以信息转发链嵌套规则进行存储。
优选地,所述信息转发嵌套规则是指每个节点都会嵌套该节点所属所有子节点的全部转发链,并且每层转发链的父节点和子节点都为一层嵌套关系,转发层数每增加一次,嵌套关系也增加一层。
优选地,所述剪枝是指切断树根节点与重复项之间的转发链。
优选地,所述根转发列表、子转发列表的获取方法是指通过解析社会网络的信息转发页面结构,分析输入信息的所有转发节点,同时获取其转发列表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310492999.1/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





