[发明专利]一种基于情感衰变因子的抑郁情绪分析方法有效
| 申请号: | 201910285499.8 | 申请日: | 2019-04-10 |
| 公开(公告)号: | CN109977231B | 公开(公告)日: | 2021-04-02 |
| 发明(设计)人: | 王泽庆;高俊波;孙伟;李岩锋;高楚瑶 | 申请(专利权)人: | 上海海事大学 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/242;G16H50/30 |
| 代理公司: | 上海元好知识产权代理有限公司 31323 | 代理人: | 徐雯琼;张妍 |
| 地址: | 201306 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 情感 衰变 因子 抑郁 情绪 分析 方法 | ||
1.一种基于情感衰变因子的抑郁情绪分析方法,其特征在于,包含以下步骤:
S1、发动人群在线填写抑郁自评量表,获得个体的抑郁量表得分以及微博昵称,并采集其微博文本,并通过专家系统对微博内容进行标注;
S2、微博文本预处理,包含文本分词、去停用词和抑郁情感词典构建;
S3、经过特征选择、特征加权,根据所述特征选择的结果与所述特征加权的结果构建词向量空间,构造文本分类器将待分类的微博文本进行分类,得到每条微博文本的抑郁情感状态;
S4、计算抑郁指数,对所述抑郁指数和所述个体的抑郁量表得分之间的相关性进行皮尔逊检测,并根据检测结果建立抑郁程度与所述抑郁指数之间的关系,以抑郁指数表征个体抑郁程度;
S5、引入情感衰变因子得到每条微博对应的抑郁情绪值,并判断个体抑郁情况,刻画个体抑郁情绪的波动情况;
所述步骤S5中进一步包含:
情感衰变因子的引入,构造情感衰变公式,得到每条微博对应的抑郁情绪值,公式为f(s)=f(s-1)+(-1)ke-λs,其中,时间s定义为相邻两条微博的时间间隔,则s的取值范围为:s=0,1,2,…,n,且任意个体的初始状态f(s=0)=0;f(s)表示s时刻这条微博所对应的抑郁情绪值;f(s-1)表示上一时刻的微博文本所对应的抑郁情绪值;λ是情感衰变因子,表示情感的衰变速度,假设抑郁情感符合半衰期规律,取λ=0.5,k的取值与相邻两时间点的微博状态有关;
所述步骤S5中,计算k的取值的方法为:
其中,c表示微博状态;当出现连续两个或以上的0状态时,若下一时刻的状态c=1,则s=1;当出现连续两个或以上的1状态时,若下一时刻的状态c=0,则s的值并不置1,而是接着上一时刻依次递增,以上两种状态交替变化过程中,f(s-1)的值保持不变,仍为上一时刻的抑郁情绪值;
所述步骤S5中,所述判断个体抑郁情况中进一步包含以下步骤:
计算每条微博的抑郁情绪值后,再计算抑郁情绪均值,如下:
其中,s=i表示从第i条微博开始考察,f(s=i)表示第i条微博的抑郁情绪值,Avg表示从第i条微博到第n条微博的抑郁情绪均值;
基于所述抑郁情绪均值,判断个体抑郁情况:
如果个体的抑郁情绪均值在[-1.6,0.2)区间时,则个体抑郁情况为情绪正常;若抑郁情绪均值在[0.2,2]区间时,则个体抑郁情况为有抑郁倾向。
2.如权利要求1所述的基于情感衰变因子的抑郁情绪分析方法,其特征在于,
所述抑郁情感词典构建进一步包括以下步骤:
步骤S231、采集抑郁情感网络流行词语;
步骤S232、从微博抽取常用抑郁情感符号;
步骤S233、在已有情感词典基础上,将采集到的网络用语和抑郁情感符号加入进去,构建抑郁情感词典,还原在所述文本分词过程中被切分的抑郁词。
3.如权利要求1所述的基于情感衰变因子的抑郁情绪分析方法,其特征在于,
所述特征选择进一步包括以下步骤:
采用CHI方法对文本进行特征选择,计算公式为:
其中,t为特征,ci为类别,N为文档数,A表示文档属于所述类别ci包含特征t,B表示所述文档不属于类别ci包含特征t,C表示所述文档属于所述类别ci不包含所述特征t,D表示所述文档不属于所述类别ci不包含所述特征t;
最后,选择特征t的最大值作为全局CHI统计量,公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910285499.8/1.html,转载请声明来源钻瓜专利网。





