[发明专利]一种社交网络抑郁情感的账户相似性度量方法在审
| 申请号: | 201510653912.3 | 申请日: | 2015-10-13 |
| 公开(公告)号: | CN105243595A | 公开(公告)日: | 2016-01-13 |
| 发明(设计)人: | 于霄 | 申请(专利权)人: | 宁波知微瑞驰信息科技有限公司;于霄 |
| 主分类号: | G06Q50/00 | 分类号: | G06Q50/00 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 315100 浙江省宁波市鄞*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 社交 网络 抑郁 情感 账户 相似性 度量 方法 | ||
1.一种社交网络抑郁情感的账户相似性度量方法,其特征在于:它包括以下步骤:
步骤一:获取欲分析的社交网络的账号在指定的网络社区d天(7≤d≤100)内的所有的自己发布的帖子的完整文字内容、自己发布的帖子的发布时间、回复评论别人的帖子的完整文字内容、回复评论别人的帖子的时间;并人工给定一份抑郁情感词列表,里面包括100个以上的抑郁倾向的情感词;人工给定一个情感相似阈值θ(θ>0)。
步骤二:对每个账号信息的完整记录,将各账号的信息进行标准化,得到标准化后的结果NT,其中包括以下16个度量量:
n1,n2,n3,n4,m1,m2,m3,m4,p1,p2,p3,p4,q1,q2,q3,q4
其中各标准化量的计算方法为:
n1=N1d-1,N1为发布时间在5点起至11点止的帖子总数目
n2=N2d-1,N2为发布时间在11点起至14点止的帖子总数目
n3=N3d-1,N3为发布时间在14点起至20点止的帖子总数目
n4=N4d-1,N4为发布时间在0点起至5点止和20点起至24点止的帖子总数目
m1=M1d-1,M1为回复评论时间在5点起至11点止的帖子总数目
m2=M2d-1,M2为回复评论时间在11点起至14点止的帖子总数目
m3=M3d-1,M3为回复评论时间在14点起至20点止的帖子总数目
m4=M4d-1,M4为回复评论时间在0点起至5点止和20点起至24点止的帖子总数目
p1=P1d-1,P1为发布时间在5点起至11点止的帖子文字中包含的抑郁情感词总数
p2=P2d-1,P2为发布时间在11点起至14点止的帖子文字中包含的抑郁情感词总数
p3=P3d-1,P3为发布时间在14点起至20点止的帖子文字中包含的抑郁情感词总数
p4=P4d-1,P4为发布时间在0点起至5点止和20点起至24点止的帖子文字中包含的抑郁情感词总数
q1=Q1d-1,Q1为回复评论时间在5点起至11点止的帖子文字中包含的抑郁情感词总数
q2=Q2d-1,Q2为回复评论时间在11点起至14点止的帖子文字中包含的抑郁情感词总数
q3=Q3d-1,Q3为回复评论时间在14点起至20点止的帖子文字中包含的抑郁情感词总数
q4=Q4d-1,Q4为回复评论时间在0点起至5点止和20点起至24点止的帖子文字中包含的抑郁情感词总数
其中抑郁情感词总数为发布或回复评论的帖子中,出现抑郁情感词列表中的词的频次。
由此,而第i个账号的特征结果NT(i)为:
NT(i)=(n1i,n2i,n3i,n4i,m1i,m2i,m3i,m4i,p1i,p2i,p3i,p4i,q1i,q2i,q3i,q4i)
步骤三:对每个账号信息,根据标准化后的信息NT,计算此账号的特征化结果,得到的特征计算结果表示为ZT,包括以下16个特征量:
PNY,PNG,PNL,PNF,RNY,RNG,RNL,RNF,PYY,PYG,PYL,PYF,RYY,RYG,RYL,RYF
各特征量计算的具体方法为:
PNY,PNG,PNL,PNF的计算方法为:
其中n1,n2,n3,n4分别为步骤二所得到的结果
RNY,RNG,RNL,RNF的计算方法为:
其中m1,m2,m3,m4为步骤二所得到的结果
PYY,PYG,PYL,PYF的计算方式为:
PYY=0.3934*arctan(p1)
PYG=0.3934*arctan(p2)
PYL=0.3934*arctan(p3)
PYF=0.3934*arctan(p4)
其中p1,p2,p3,p4为步骤二所得到的结果
RYY,RYG,RYL,RYF的计算方式为:
RYY=0.6366*arctan(q1)
RYG=0.6366*arctan(q2)
RYL=0.6366*arctan(q3)
RYF=0.6366*arctan(q4)
其中q1,q2,q3,q4为步骤二所得到的结果
由此,而第i个账号的特征结果ZT(i)为
ZT(i)=(PNYi,PNGi,PNLi,PNFi,RNYi,RNGi,RNLi,RNFi,PYYi,PYGi,PYLi,PYFi,RYYi,RYGi,RYLi,RYFi)
步骤四:根据每个账号的特征化结果ZT,计算两两账号之间的情感相似程度值Dis,用Dis(i,j)表示i,j两个账号之间的情感相似程度值,ZT(i)和ZT(j)分别为i,j两个账号在步骤四的特征化结果,即是
ZT(i)=(PNYi,PNGi,PNLi,PNFi,RNYi,RNGi,RNLi,RNFi,PYYi,PYGi,PYLi,PYFi,RYYi,RYGi,RYLi,RYFi)
ZT(j)=(PNYj,PNGj,PNLj,PNFj,RNYj,RNGj,RNLj,RNFj,PYYj,PYGj,PYLj,PYFj,RYYj,RYGj,RYLj,RYFj)
而Dis(i,j)的计算方式如下:
Dis(i,j)=
(PNYi*PNYj+PNGi*PNGj+PNLi*PNLj+PNFi*PNFj+
RNYi*RNYj+RNGi*RNGj+RNLi*RNLj+RNFi*PNFj+
PYYi*PYYj+PYGi*PYGj+PYLi*PYLj+PYFi*PYFj+
RYYi*RYYj+RYGi*RYGj+RYLi*RYLj+RYFi*RYFj)*
(PNYi2+PNGi2+PNLi2+PNFi2+RNYi2+RNGi2+RNLi2+
RNFi2+PYYi2+PYGi2+PYLi2+PYFi2+RYYi2+RYGi2+RYLi2+RYFi2)-0.5*
(PNYj2+PNGj2+PNLj2+PNFj2+RNYj2+RNGj2+RNLj2+
RNFj2+PYYj2+PYGj2+PYLj2+PYFj2+RYYj2+RYGj2+RYLj2+RYFj2)-0.5
步骤五:根据步骤四得到的两两账号之间的情感相似值Dis,将Dis与设定的情感相似阈值θ比较,Dis小于θ时,判定此两个账号的情感值相似。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波知微瑞驰信息科技有限公司;于霄,未经宁波知微瑞驰信息科技有限公司;于霄许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510653912.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:煤矿巷道矸石转载、支护一体机
- 下一篇:一种无实物票据的验票方法





