[发明专利]基于个人微博的个人异常情绪检测方法及装置在审
申请号: | 201810015610.7 | 申请日: | 2018-01-08 |
公开(公告)号: | CN108256016A | 公开(公告)日: | 2018-07-06 |
发明(设计)人: | 孙晓;张陈;丁帅;杨善林 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;余罡 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 微博 预设 正态分布曲线 多维数据集 文本数据 预设时间段 情绪 检测 概率 多元正态分布 支持向量机 定量分析 分布统计 情感识别 时间单位 联合 拟合 标注 定性 | ||
本发明提供了一种基于个人微博的个人异常情绪检测方法及装置。该方法包括:获取预设时间段内指定用户的第一预设数量条微博文本数据;利用支持向量机对第一预设数量条微博文本数据进行情感识别并标注,得到第二预设数量种情感;按照预设时间单位对第二预设数量种情感的微博文本数据进行情感分布统计,得到指定用户的多维数据集;采用多元正态分布对预设时间段的多维数据集进行拟合,得到对应情感的正态分布曲线;计算多维数据集的联合概率密度值;基于正态分布曲线和/或联合概率密度值确定指定用户的异常情绪。可见,本发明通过获取正态分布曲线和联合概率密度值可以定性和定量分析指定用户的异常情绪,能够提高检测的准确性的可靠性。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于个人微博的个人异常情绪检测方法及装置。
背景技术
目前基于个人微博的个人异常情绪检测方案主要有:
方案一,异常文本词典。该方案中将伤心、愤怒和抑郁等词收集为一个词典,然后进行情感词匹配检测出个体微博文本数据中的异常词语,进而判断出异常文本和出现异常情绪的用户。可见,异常文本词典的检测方法比较简单,检测结果准确度较高。这样检测结果只能检测出异常的情绪,但是却检测不出用户暗含的异常情绪。并且部分用户选择将微博作为宣泄的平台或者本身性格就是易怒和悲伤的,可能这部分用户所有微博都是这种状态和词汇,此时异常词典则无法准确检测。
方案二,对用户文本进行情感极性识别(正面,负面,中性),用于判断公众用户对热门事件的情感倾向,然后从标注中选择负面的文本作为异常个性判定的依据。但是社交平台上的消极内容较多,所检测出的消极微博文本数据并不一定说明该用户情绪出现了异常。例如用户对当今一些热点话题的批判或者对某件商品的吐槽等,这些是客观评述,而非异常的情绪。
发明内容
针对现有技术中的缺陷,本发明提供了一种基于个人微博的个人异常情绪检测方法及装置,用于解决相关技术中异常词典方式或者负面文本异常判定方式时无法准确检测用户异常情绪的问题。
第一方面,本发明实施例提供了一种基于个人微博的个人异常情绪检测方法,所述方法包括:
获取预设时间段内指定用户的第一预设数量条微博文本数据;
利用支持向量机对所述第一预设数量条微博文本数据进行情感识别并标注,得到第二预设数量种情感;
按照预设时间单位对所述第二预设数量种情感的微博文本数据进行情感分布统计,得到所述指定用户的多维数据集;所述预设时间段的长度为所述预设时间单位的数倍;
采用多元正态分布对所述预设时间段的多维数据集进行拟合,得到所述指定用户对应情感的正态分布曲线;
计算每个多维数据集的联合概率密度值;
基于所述正态分布曲线和/或所述联合概率密度值确定所述指定用户的异常情绪。
可选地,所述第二预设数量种情感为5种,分别为中性、开心、惊讶、伤心和生气,对应的标签为0、1、2、3和4。
可选地,按照预设时间单位对所述第二预设数量种情感的微博文本数据进行情感分布统计,得到所述指定用户的多维数据集包括:
根据支持向量机对所述第一预设数量条微博文本数据进行情感分类;
根据情感分类确定所述指定用户的五维数据集。
可选地,基于所述联合概率密度值确定所述指定用户的异常情绪包括:
对比联合概率密度值和密度值阈值;
若所述联合概率密度值小于或者等于密度值阈值,则所述指定用户的情绪异常。
可选地,选取所述密度值阈值包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810015610.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:页面展示方法及装置
- 下一篇:一种用于数据存储的方法、装置及计算机设备