[发明专利]一种多特征融合的微博用户权威度评价方法有效

专利信息
申请号: 201710455299.3 申请日: 2017-06-16
公开(公告)号: CN107169873B 公开(公告)日: 2021-05-11
发明(设计)人: 张仰森;郑佳;黄改娟 申请(专利权)人: 北京信息科技大学
主分类号: G06Q50/00 分类号: G06Q50/00;G06K9/62
代理公司: 北京科亿知识产权代理事务所(普通合伙) 11350 代理人: 汤东凤
地址: 100101 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种多特征融合的微博用户权威度评价方法,该方法在新浪微博的用户信息体系的基础上,总结出了用户基本信息完整度、用户传播影响力、用户活跃度以及用户平台指数4项影响用户权威度的特征,并分别给出了提取与计算方法。在用户信息传播影响力的计算中,提出了一种基于PageRank算法改进的UserRank模型,并通过实验验证了其相对于PageRank算法更加有效。最后,基于层次分析法确定了4项用户特征的权值,构建了多特征融合的微博用户权威度评价模型并进行了相关实验。实验结果表明,本发明提出的方法计算的微博用户权威度比较合理,为用户权威度的定量评价提供了一种可行的解决方案。
搜索关键词: 一种 特征 融合 用户 权威 评价 方法
【主权项】:
一种多特征融合的微博用户权威度评价方法,其特征在于,包括以下步骤:步骤1、建立多特征融合的微博用户权威度定量评价体系:根据用户权威度评价的要求,通过分析新浪微博的用户信息平台,提取微博用户的个人信息指标和微博用户的行为数据指标,构建用户权威度评价指标特征四元组E(fUI,fUR,fUA,fUPA),其中,fUI为用户基本信息完整度,fUR为用户传播影响力,fUA为用户活跃度,fUPA为用户平台指数;将用户权威度定义为评价指标特征四元组E(fUI,fUR,fUA,fUPA)中各个评价指标特征的线性加权和,如式(1)所示:Authority=w1·fUI+w2·fUR+w3·fUA+w1·fUPI  (1)其中,wi(i=1,2,3,4)为各个评价指标特征的权值系数,满足wi>0且步骤2、用户特征四元组中各评价指标的权值系数确定:本发明采用层次分析法中的特征向量法对权值系数进行确定,具体的权重计算过程如下:(1)构造用户权威度评价特征的判断矩阵如式(2)所示:A=1191315913231311251221---(2)]]>其中,判断矩阵A中的元素aij表示两个特征相比,特征i的重要程度比特征j重要程度重要的倍数,一般是引入数字1‑9及其导数作为度量;(2)求解判断矩阵的最大特征值的特征向量,并进行一致性检验;对式(2)的用户特征判断矩阵A采用Matlab的eig()函数求取全部特征值,构成对角阵D如式(3)所示,并求取判断矩阵A的所有特征向量构成的列向量矩阵V如式(4)所示:D=4.008000002.5883e-160000-0.0040+0.1785i0000-0.0040-0.1785i---(3)]]>V=0.0909-0.16220.0267-0.0266i0.0267-0.0266i0.84130.97330.7942+0.0000i0.7942+0.0000i0.26110.1622-0.1965+0.1992i-0.1965+0.1992i0.46460.0000-0.2243-0.4892i-0.2243-0.4892i---(4)]]>通过式(3)得到用户判断矩阵A的最大特征值λmax=4.0080,则矩阵A的最大特征值特征向量为w=[0.0909,0.8413,0.2611,0.4646]T;用户特征判断矩阵的一致性检验过程如下:①计算一致性指标CI如式(5)所示:CI=λmax-nn-1---(5)]]>②查找判断矩阵对应的平均随机一致性指标RI;③计算一致性比例CR如式(6)所示:CR=CIRI---(6)]]>当CR<0.1时,则认为构建的判断矩阵的一致性是能接受的,否则,需要对判断矩阵做相应的修改再次计算;通过一致性检验,构建的用户权威度评价的用户特征判断矩阵的一致性比例为CR=0.0030,远小于0.1,符合一致性检验结果;(3)对上面求出来的特征向量w进行归一化处理即得到式(1)中各个用户特征的权值系数为(w1,w2,w3,w4)=(0.0548,0.5075,0.1575,0.2802);步骤3、用户基本信息完整度的计算:将用户基本信息完整度UI(User Integrity)定义为微博用户在注册微博平台账号时,愿意向公众公开的个人基本信息标签占微博用户基本信息体系标签总数的比例;其计算如式(7)所示:UI=Σi=1nIPin---(7)]]>其中,n为微博用户基本信息体系中标签的总数量,取值为12,IPi的定义如式(8)所示:步骤4、用户传播影响力的计算:设FU(Uj,Ui)表示用户Uj转发用户Ui微博的次数,CU(Uj,Ui)为用户Uj评论用户Ui微博的次数,利用微博用户间转发与评论微博的次数给微博用户关注关系添加关系价值如式(9)所示:W(Uj,Ui)=α·FU(Uj,Ui)+β·CU(Uj,Ui)  (9)其中,α和β分别代表转发微博与评论微博的权值系数,满足α>0,β>0且α+β=1;采用微博用户关注与被关注的关系价值,定义用户的微博传播指数为:若存在用户Ui,其粉丝的集合为B,则用户Ui的微博传播指数为其粉丝集合B中所有粉丝对其关注的权值之和,计算如式(10)所示:T(Ui)=ΣUj∈BW(Uj,Ui)---(10)]]>利用用户的微博传播指数对PageRank算法进行改进,在微博用户关系之间引入关系权值,构建用户传播影响力的UserRank算法,那么UserRank值即为用户传播影响力,计算方式如式(11)所示:UR(Ui)=qΣUj∈BUR(Uj)·W(Uj,Ui)T(Uj)+1-qn---(11)]]>其中,UR(Ui)表示用户Ui在用户关注关系网络中的传播影响力,q为阻尼系数;步骤5、用户活跃度的计算:根据微博用户发布微博的数目和微博用户评论其它微博用户微博的数目,定义用户活跃度UA为微博用户在一定时间内发布微博数目与评论其它微博用户微博的数目的线性加权求和对时间的均值,计算如式(12)所示:UA=Σi=1n(α·wi+β·ci)n---(12)]]>其中,n表示计算时间段的总天数,取近期的一个月或者一年的数据进行计算,或者定义为从注册日起到现在为止的所有数据;wi与ci分别表示用户在第i天发布的微博的数目与评论其它微博用户微博的数目,α和β分别表示用户发布微博数目与评论微博数目的权值,且满足α>0,β>0且α+β=1;它们所占比例相同,即α=β=0.5;步骤6、用户平台指数的计算:根据用户权威度评价特征提取的用户权威度评价特征,用户平台指数包含3项内容,分别是是否是认证用户、是否是VIP用户以及用户勋章数;采用这三项内容构建用户平台指数的计算方法如式(13)所示:UPI=α·A+β·M+γ·M  (13)其中,A表示微博用户是否经过平台认证,M表示微博用户具有的勋章数,V表示微博用户是否是VIP会员用户,α、β和γ为三者的权值,由于这三项特征之间相对的重要性并不相同,同样采用层次分析法中的特征向量法确定各自的权值,构建用户平台指数判断矩阵如式(14)所示:A=194191121421---(14)]]>通过计算,得到式(14)的判断矩阵A的最大特征值为λmax=3.0015,计算判断矩阵的一致性比例为CR=0.0014,远远小于0.1,符合一致性检验结果,说明式(14)的构造的判断矩阵是合理的;最后,将最大特征值的特征向量进行归一化处理,得到用户平台指标的各项用户特征的权值为(α,β,γ)=(0.7373,0.0853,0.1773)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710455299.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top