[发明专利]一种重点博主追踪确认方法及装置有效
| 申请号: | 201511015944.7 | 申请日: | 2015-12-31 |
| 公开(公告)号: | CN105447196B | 公开(公告)日: | 2019-03-05 |
| 发明(设计)人: | 陈志群;李晓亮;廖庆平;易杰 | 申请(专利权)人: | 深圳中泓在线股份有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
| 代理公司: | 深圳市港湾知识产权代理有限公司 44258 | 代理人: | 董前进 |
| 地址: | 518000 广东省深圳市南山区西*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 重点 追踪 确认 方法 装置 | ||
1.一种重点博主追踪确认方法,其特征在于,包括以下步骤:
选取一个以上的微博舆情事件,根据该一个以上的微博舆情事件相对应的事件关键词在微博上下载相关微博数据,对相关微博数据内的每一个博主进行事件参与度统计计算出每一个博主的事件参与度值;
将相关微博数据内的微博数据属性值均作为一个分析因子,根据统计学公式计算出每一个博主的基础总分值;
对每一个博主的每一个原创微博进行语义分析找出正面关键词及负面关键词,统计正面关键词数及负面关键词数由正面关键词数及负面关键词数计算出每一个博主的心态指数;
由事件参与度值、基础总分值及心态指数计算出每一个博主的博主权重值,将该博主权重值与预设的权重阈值进行比较来确认重点博主。
2.根据权利要求1所述的一种重点博主追踪确认方法,其特征在于,包括以下步骤:
选取N个微博舆情事件,根据该N个微博舆情事件相对应的事件关键词在微博上下载相关微博数据,对相关微博数据内的每一个博主进行事件参与度统计计算出每一个博主的事件参与度值G:
G=(W1*Q1+W2*Q2+…+Wd*Qd+…+Wf*Qf)*S/N,其中S为参与事件数,N为舆情事件总数,d=1、2、…、f,f为相关微博数据内的微博数据属性值的个数,f≥3,Wd为每个微博数据属性值的个数,Qd为每个微博数据属性值的参与度权重,Q1+Q2+…+Qd+…+Qf=1,N≥1;
将相关微博数据内的微博数据属性值均作为一个分析因子,根据统计学公式计算出每一个博主的基础总分值Total:
Total=V1*T1+V2*T2+…+Vi*Ti+…+Vf*Tf,其中i=1、2、…、f,f为相关微博数据内的微博数据属性值的个数,f≥3,Vi为每一个分析因子的基础分权重,V1+V2+…+Vi+…+Vf=1,Ti为每一个分析因子的T分值;
对每一个博主的每一个原创微博进行语义分析找出正面关键词及负面关键词,统计正面关键词数及负面关键词数由正面关键词数及负面关键词数计算出每一个博主的心态指数H:
H=(h1+h2+…+hk+…+hn)/n,其中k=1、2、…、n,n≥1,n为每一个博主发出的原创微博数,hk=reverse/obverse,hk为每一个原创微博的正负关键词比例,reverse为负面关键词数,obverse为正面关键词数;
由事件参与度值、基础总分值及心态指数计算出每一个博主的博主权重值Imp,将该博主权重值与预设的权重阈值进行比较来确认重点博主:
其中,Imp=Total+G*H。
3.根据权利要求2所述的一种重点博主追踪确认方法,其特征在于,所述T=(标准分满分/2)+(标准分制*10/100)*标准分Z,标准分Z=(Xi-X_bar)/Y,其中i=1、2、…、m,m≥1,m为博主的个数,Xi为对应每一个分析因子时每一个博主的样本数值,X_bar为每一个分析因子的样本平均值,Y为每一个分析因子的样本标准差。
4.根据权利要求3所述的一种重点博主追踪确认方法,其特征在于,所述标准分满分为100,所述标准分制为100。
5.根据权利要求1-4任一项所述的一种重点博主追踪确认方法,其特征在于,将该博主权重值与预设的权重阈值进行比较,若博主权重值大于预设的权重阈值,则该博主权重值对应的博主确定为重点博主,若博主权重值小于预设的权重阈值,则该博主权重值对应的博主确定为非重点博主。
6.根据权利要求1所述的一种重点博主追踪确认方法,其特征在于,根据该一个以上的微博舆情事件相对应的事件关键词在微博上下载相关微博数据为:对微博页面进行分析,获得解析模板,由解析模板采用数据模板匹配属性值的方式根据该一个以上的微博舆情事件相对应的事件关键词在微博上下载微博基本属性数据,由微博基本属性数据拼接目标url地址,获取其他相关信息微博页面,再对其他相关信息微博页面进行分析获得解析模板,由解析模板采用数据模板匹配属性值的方式下载解析超过100个微博数据属性值入库保存。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳中泓在线股份有限公司,未经深圳中泓在线股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511015944.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种分享信息的优化方法及终端
- 下一篇:信息抓取方法及装置





