[发明专利]监控舆情的方法和设备有效
申请号: | 201410773605.4 | 申请日: | 2014-12-12 |
公开(公告)号: | CN104504031B | 公开(公告)日: | 2018-02-02 |
发明(设计)人: | 于魁飞 | 申请(专利权)人: | 北京智谷睿拓技术服务有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F11/30 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙)11413 | 代理人: | 马敬,项京 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 监控 舆情 方法 设备 | ||
1.一种监控舆情的方法,其特征在于,包括:
确定待评估文本,其中,所述待评估文本至少包括在第一时间段内发布的第一文本集和在第二时间段内发布的第二文本集;
根据一用户情感随时间演变的模型,至少确定所述第一文本集在所述第一时间段令用户产生每一种情感倾向的概率分布,以及所述第二文本集在所述第二时间段令用户产生每一种情感倾向的概率分布;
至少根据所述第一文本集在所述第一时间段令用户产生每一种情感倾向的概率分布,以及所述第二文本集在所述第二时间段令用户产生每一种情感倾向的概率分布,确定至少一异常情感倾向;
确定所述至少一异常情感倾向中的每一种异常情感倾向产生于任一时间的概率。
2.如权利要求1所述的方法,其特征在于,根据一用户情感随时间演变的模型,至少确定所述第一文本集在所述第一时间段令用户产生每一种情感倾向的概率分布,以及所述第二文本集在所述第二时间段令用户产生每一种情感倾向的概率分布,包括:
对所述待评估文本进行预处理,确定每一个待评估文本的文字向量和每一个待评估文本的情感向量;
将每一个待评估文本的文字向量中的每一个有效单词和每一个待评估文本的情感向量绑定,得到每一个待评估文本的元组;
将每一个待评估文本的元组输入所述用户情感随时间演变的模型中与所述每一个待评估文本的发布时间对应的子模型,根据所述用户情感随时间演变的模型的输出结果,至少确定所述第一文本集中在所述第一时间段令用户产生每一种情感倾向的概率分布,以及所述第二文本集在所述第二时间段令用户产生每一种情感倾向的概率分布。
3.如权利要求2所述的方法,其特征在于,至少根据所述第一文本集在所述第一时间段令用户产生每一种情感倾向的概率分布,以及所述第二文本集在所述第二时间段令用户产生每一种情感倾向的概率分布,确定至少一异常情感倾向,包括:
至少确定第一时间段内发布的文本令用户产生每一种情感倾向的概率分布与第二时间段内发布的文本令用户产生每一种情感倾向的概率分布的距离;
根据所述第一时间段内发布的文本令用户产生每一种情感倾向的概率分布与第二时间段内发布的文本令用户产生每一种情感倾向的概率分布的距离,确定至少一异常情感倾向。
4.如权利要求1至3中任一所述的方法,其特征在于,所述方法还包括:
建立所述用户情感随时间演变的模型。
5.如权利要求4所述的方法,其特征在于,所述建立所述用户情感随时间演变的模型,包括:
确定至少一训练文本;
对所述至少一训练文本进行预处理,确定每一个训练文本的文字向量和每一个训练文本的情感向量;
根据每一个训练文本的所述文字向量、每一个训练文本的所述情感向量以及每一个训练文本的发布时间,确定用户情感随时间演变的模型。
6.如权利要求5所述的方法,其特征在于,所述根据每一个训练文本的所述文字向量、每一个训练文本的所述情感向量以及每一个训练文本的发布时间,确定用户情感随时间演变的模型,包括:
将每一个训练文本的文字向量中的每一个有效单词和每一个训练文本的情感向量绑定,得到每一个训练文本的多个元组;
对至少一时间段发布的训练文本进行统计,确定所述至少一时间段内发布的第i个训练文本中出现元组r的概率P(元组r|训练文本i);
根据所述P(元组r|训练文本i),通过一算法,确定所述第i个训练文本选择主题k的概率P(主题k|训练文本i)以及所述主题k产生元组r的概率P(元组r|主题k);
根据所述P(主题k|训练文本i)和所述P(元组r|主题k),确定至少一时间段内任一文本产生任一元组的近似后验分布P(元组|文本)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智谷睿拓技术服务有限公司,未经北京智谷睿拓技术服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410773605.4/1.html,转载请声明来源钻瓜专利网。