[发明专利]基于微博文本的公众情感分布建模方法及装置在审
申请号: | 201711217525.0 | 申请日: | 2017-11-28 |
公开(公告)号: | CN107886442A | 公开(公告)日: | 2018-04-06 |
发明(设计)人: | 孙晓;张陈;丁帅;杨善林 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06F17/18;G06K9/62 |
代理公司: | 北京路浩知识产权代理有限公司11002 | 代理人: | 王莹,余罡 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文本 公众 情感 分布 建模 方法 装置 | ||
1.一种基于微博文本的公众情感分布建模方法,其特征在于,所述方法:
获取预设时间段内第一预设数量条微博文本数据;
利用支持向量机对所述第一预设数量条微博文本数据进行情感识别,得到第二预设数量种情感;
对不同情感分类的微博文本进行统计,得到每个用户分类对应的多维数据;所述多维数据的维数等于所述第二预设数量;
基于所述多维数据,利用K-S检测算法对所述第一预设数量条微博文本的情感建立模型;
根据所述模型的P-value值判断所述多维数据是否服从多元高斯分布;若不服从,则基于用户发布微博的数目和用户的数目,利用残差和的方法对微博数据进行幂律分布检验。
2.根据权利要求1所述的公众情感分布建模方法,其特征在于,利用支持向量机对所述第一预设数量条微博文本数据进行情感识别,得到第二预设数量种情感包括:
根据支持向量机对微博文本进行情感识别,得到第二预设数量种情感分类;
根据标签和情感的关系,利用不同标签标注所述第二预设数量种情感对应的所述第一预设数量条微博文本数据。
3.根据权利要求2所述的公众情感分布建模方法,其特征在于,所述第二预设数量种情感为5种,分别为中性、开心、惊讶、伤心和生气。
4.根据权利要求1所述的公众情感分布建模方法,其特征在于,根据所述模型的P-value值判断所述多维数据是否服从多元高斯分布之后还包括:
若所述多维数据服从所述多元高斯分布,则获取用户发布微博文本的情感整体分布;
利用联合概率密度函数确定异常的用户。
5.一种基于微博文本的公众情感分布建模装置,其特征在于,所述装置包括:
文本数据获取模块,用于获取预设时间段内第一预设数量条微博文本数据;
文本情感识别模块,用于利用支持向量机对所述第一预设数量条微博文本数据进行情感识别,得到第二预设数量种情感;
多维数据获取模块,用于对不同情感分类的微博文本进行统计,得到每个用户分类对应的多维数据;所述多维数据的维数等于所述第二预设数量;
模型建立模块,用于基于所述多维数据,利用K-S检测算法对所述第一预设数量条微博文本的情感建立模型;
判断模块,用于根据所述模型的P-value值判断所述多维数据,是否服从多元高斯分布;并在不服从时,触发幂律分布检验模块;
幂律分布检验模块,用于基于用户发布微博的数目和用户的数目,利用残差和的方法对微博数据进行幂律分布检验。
6.根据权利要求5所述的公众情感分布建模装置,其特征在于,所述文本情感识别模块包括:
情感分类识别单元,用于根据支持向量机对微博文本进行情感识别,得到第二预设数量种情感分类;
文本数据标注单元,用于根据标签和情感的关系,利用不同标签标注所述第二预设数量种情感对应的所述第一预设数量条微博文本数据。
7.根据权利要求6所述的公众情感分布建模装置,其特征在于,所述第二预设数量种情感为5种,分别为中性、开心、惊讶、伤心和生气。
8.根据权利要求5所述的公众情感分布建模装置,其特征在于,所述判断模块包括:
情感分布单元,用于在所述多维数据服从所述多元高斯分布时,获取用户发布微博文本的情感整体分布;
异常用户确定单元,用于利用联合概率密度函数确定异常的用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711217525.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种管道弯头支撑结构
- 下一篇:一种M型落地支架支撑结构