[发明专利]一种网络个体或群体情绪认知能力预测与可视化方法在审
| 申请号: | 201410795679.8 | 申请日: | 2014-12-18 |
| 公开(公告)号: | CN104636425A | 公开(公告)日: | 2015-05-20 |
| 发明(设计)人: | 周建栋;赵燕平;张华平;李想 | 申请(专利权)人: | 北京理工大学;北京化工大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
| 代理公司: | 无 | 代理人: | 无 |
| 地址: | 100081 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 网络 个体 群体 情绪 认知 能力 预测 可视化 方法 | ||
1.一种网络个体或群体情绪认知能力预测与可视化方法,其特征在于:包括以下步骤:
步骤1)构建可整合多来源情感词的本体库;
步骤2)确定网络个体情绪分叉点位置,根据按时间序列采集的网络个体发表的文本信息集计算其情绪认知能力指数序列;
步骤3)对步骤2)得到的情绪认知能力指数序列进行可视化;
步骤4)对多个网络个体的情绪认知能力指数水平进行对比分析。
2.根据权利要求1所述的一种网络个体或群体情绪认知能力预测与可视化方法,其特征在于:所述步骤1)构建情感词本体库,进一步包括以下步骤:
步骤1-1)将现有中文情感词典中的常用情感词以及从语料集中筛选出的网络情感新词和表情符号合并得到情感元素集;
步骤1-2)对所述情感元素集中的每个词Wi确定情感强度Ii并进行情感极性标注Pi;
步骤1-3)筛选出情感强度Ii超过阈值的词Wi,将词Wi与其情感极性Pi和情感强度Ii作为三元组加入情感词本体库E,得到E为:
E=<(W1,P1,I1),(W2,P2,I2),...,(Wi,Pi,Ii),...,(Wn,Pn,In)>。
3.根据权利要求2所述的一种网络个体或群体情绪认知能力预测与可视化方法,其特征在于:所述步骤1-2)进一步包括以下步骤:
步骤1-2-1)情感极性标注:常用情感词的极性Pi与情感词典中的极性一致,如发生同一情感词在不同情感词典中的标注不一致的情形,使用多人投票方式修正;网络情感新词与表情符号由于数量有限,其极性均采用多人投票方式确定;
步骤1-2-2)情感强度确定:
(1)常用情感词的情感强度确定:首先获取大规模社交网络文本集U,然后根据下式计算常用情感词w*的情感强度:
I(w*)=r(w*|S负)-r(w*|S正)
其中S正和S负分别表示在社交网络文本集U中的正情感词和负情感词集合,r(w*|S正)表示w*的正向情感权重,r(w*|S负)表示w*的负向情感权重,情感权重通过下式计算;
其中S*表示S正或者S负,α、β∈[0,1]是组合调整参数,Ci是w*的第i个字,w*中共有k个字,P(Ci|S*)及P(w*)则可通过下式计算:
其中Freq(S*,Ci)表示属于S*的词的组成字Ci在U中出现的频率,Freq(S*)表示属于S*的所有组成字在U中出现的频率之和;δ为一个较小的数值;
其中Freq(w*)表示w*在U中出现的频率,|U|表示U中词的个数,表示U中所有的词wi在U中出现的频率之和;
(2)常用情感词的情感极性修正:
当情感强度I大于0,表示正情感,情感极性P=+1;
当情感强度I小于0,表示负情感,情感极性P=-1;
(3)网络情感新词与表情符号由于数量有限,其情感强度均在参考常用情感词强度基础上采用多人投票方式确定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学;北京化工大学;,未经北京理工大学;北京化工大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410795679.8/1.html,转载请声明来源钻瓜专利网。





