[发明专利]基于微博平台的用户可信度评估方法有效
| 申请号: | 201310001463.5 | 申请日: | 2013-01-04 |
| 公开(公告)号: | CN103136330A | 公开(公告)日: | 2013-06-05 |
| 发明(设计)人: | 李石君;王峰;余伟;甘琳;杨莎;王俊;刘晶;丁永刚 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 严彦 |
| 地址: | 430072 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 平台 用户 可信度 评估 方法 | ||
技术领域
本发明属于信息可信度的研究范畴,特别涉及的研究领域包括微博平台上的用户可信度。
背景技术
基于全球著名的微博平台Twitter和新浪微博等微博平台上的可信度研究是一个新兴的研究领域,涉及的研究领域包括微博平台上的用户可信度,评论可信度,事件可信度,主题专家的探测,广告投放效果的实际价值等一切跟微博平台上的信息可信度相关的技术领域。该领域涉及到的主要研究对象,关键技术和实际应用价值主要包括:
微博上的主题专家搜索:Saptarshi Ghosh等人利用众包的智慧设计出了一套取名为Cognos的系统,该系统能够找出Twitter上的主题专家。他们在建立专家搜索系统之前,提取了包含在众包列表中的信息,信息包括三部分:1.建立Twitter用户众包列表;2.挖掘元数据以推断单个Twitter用户的主题经验;3.给一个查询主题,按用户相对经验值排序,把跟查询匹配的主题专家按照排序输出;因为Twitter作为一个广泛受欢迎的系统,能够发掘网络上的实时信息,众包列表的思想在该文中为Twitter上将来的内容搜索,推荐和发现服务建立了有价值的基础。该文中同时还提到了当前基于列表的方法对于网络垃圾而言是脆弱的,即恶意用户能够创建伪造列表,这些伪造列表包括一个目标用户对用户推断属性的操控。迄今为止,虽然没有找到这类攻击的证据,然而这类攻击在不久的将来很容易发动起来。这类攻击的防御方法就要求考虑创建列表的用户的信誉。
Twitter上评估事件可信度:Manish Gupta等人研究出了与用户和微博相关的一系列事件可信度自动评估的问题,提出了一套基于事件图优化的可信度分析方法。首先在由事件,微博和用户组成的多类型网络上实施类Page-Rank可信度传播实验,然后在每一次的迭代中通过一个新事件图的规范化更新事件的可信度得分,从而加强基本的信任分析。该文的主要贡献在于:1.为了计算Twitter事件的可信度,提出了BasicCA方法,该方法为多类型网络上权威的传播运用类Page-Rank迭代,这种多类型网络由事件,微博和用户组成。2.提出了EventOptCA算法在每次迭代过程中构建事件图,利用相似事件应该具有相似的可信度得分的直觉加强事件可信度的值。3.利用从两大数据集中提取的457个新闻事件证明了本文中提到方法的比基于分类器特征方法的准确性更高。
Twitter上以实体为中心主题导向的观点概括:诸如Twitter一类的微博服务已经变成人们 在一个大范围的主题上表达自己观点的大众渠道。Twitter平台每分钟都承载着包含用户情感和态度的大量信息。观点的自动概括和给概括系统构成的巨大挑战同样都迫切需要。Xinfan Meng等人在论文中研究了Twitter平台上的名人,商标等实体的观点概括问题。该文中提出了一种以实体为中心的主题导向的观点概括框架,目的是产生跟主题一致的观点概括和显著强调观点背后的洞察力。为了达到这个目标,首先从Twitter上的标签,带人为注解的情感标签中挖掘主题。把标签作为弱监督信息集成到主题模型算法中以获取更好的解释和表示,用于计算标签间的相似度,采用近邻传播聚类算法把标签分组成连贯的主题。之后,采用目标依赖情感分类方法识别给定消息目标的观点。最终,观点概括在一个统一的优化框架中通过来自于主题,观点和洞察力等其他因素的集成信息产生。通过真实数据集上的扩展实验评估个人观点概括模块的性能和产生的概要信息的质量。实验结果表明了所提框架和算法的有效性。
Twitter开放域的事件抽取:Twitter消息是最新的,包含了事件的信息流和评论流,但它们又同样是支离破碎,充满杂质的,这样就刺激了抽取,聚类重要事件系统的需求。之前关于抽取事件的结构化表示的工作大部分都关注于新闻专线文本。Twitter独特的特征给开放域事件抽取带来了一种新的挑战和机遇。Alan Ritter等人在文中提出了TWICAL,它是Twitter平台上的第一个开放域事件抽取和分类系统。来自于Twitter的重要事件开放域日程表的精确抽取是切实可行的。
概括和分析Twitter消息的框架:通过社交网络上的用户和诸如Facebook和Twitter上的微博网址产生的数据量是巨大的。这些数据的实时分析是一个挑战,当前大多数都关注于当前产生数据的有效率查询和检索。XintianYang等人在论文中提出了一种有效的流概括框架,该框架能够递增式的建立Twitter消息流的概要。并且提出了一种算法来压缩Twitter消息,该消息具有压缩率低,质量高和运行时间短的特点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310001463.5/2.html,转载请声明来源钻瓜专利网。





