[发明专利]基于概率特征关联的舆情分析方法在审
| 申请号: | 201710441705.0 | 申请日: | 2017-06-13 |
| 公开(公告)号: | CN107239562A | 公开(公告)日: | 2017-10-10 |
| 发明(设计)人: | 程华;姚俊;马宇舸;房一泉 | 申请(专利权)人: | 华东理工大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 常州市权航专利代理有限公司32280 | 代理人: | 袁兴隆 |
| 地址: | 200237 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 概率 特征 关联 舆情 分析 方法 | ||
1.一种基于概率特征关联的舆情分析方法,其特征在于,包括以下步骤:
步骤一、收集某一新闻事件的长期信息,取长期信息中的长期特征词项组成文本信息的长期词典;
步骤二、取当前新闻文本信息的特征词项组成的当前特征集合;
步骤三、将长期词典与当前特征词项进行关联,以当前特征词项为中心、基于特征词项的相似度设置圆形关联门,获取当前特征词项关联门内的长期特征词项的特征集合以及该特征集合对应的权重向量;
步骤四、分别求步骤三中关联门内长期特征词项的词向量和当前特征词项的词向量,并求两者词向量间的关联概率;
步骤五、通过所述关联概率计算当前特征词项的最优特征权值,并生成当前特征集合对应的最优当前特征权值向量;
步骤六、将所述最优当前特征权值向量用于软传感器模型对当前新闻事件进行态势估计,得到当前新闻事件的态势融合估计。
2.如权利要求1所述的基于概率特征关联的舆情分析方法,其特征在于,步骤一中,使用长期词典法获取事件长期信息中的长期态势,作为用于关联融合的长期态势向量,所述长期词典由q个所述长期特征词项lwt,i构成,表示为LDt={lwt,1,lwt,2,lwt,3…lwt,q},在向量空间模型VSM空间下抽取长期词典中的特征词项权重向量,表示为LVt={lvt,1,lvt,2,lvt,3…lvt,q},其中,lwt,i对应的权重为lvt,i。
3.如权利要求2所述的基于概率特征关联的舆情分析方法,其特征在于,步骤二中,t时刻所述当前特征集合由n个当前特征词项cwt,i构成,表示为CFt={cwt,1,cwt,2,cwt,3…cwt,n},在向量空间模型VSM空间下抽取当前特征集合中的特征词项权重向量,表示为CVt={cvt,1,cvt,2,cvt,3…cvt,n},其中,cwt,i对应的权重为cvt,i。
4.如权利要求3所述的基于概率特征关联的舆情分析方法,其特征在于,特征词项的权重采用TF-IDF方法计算,权重表达对应特征词项在文本中的重要程度。
5.如权利要求4所述的基于概率特征关联的舆情分析方法,其特征在于,所述权重cvt,i=tfi log(M/ni+0.01),其中,tfi为特征词项cwt,i在文本信息中出现次数,M表示数据集中文本信息的总数,ni表示含有该特征词项的文本信息数。
6.如权利要求5所述的基于概率特征关联的舆情分析方法,其特征在于,步骤三中,所述关联门半径Rt为:所述特征词项cwt,i关联门内的特征集合LCFt,i为:LCFt,i={lwt,f|Similar(lwt,f,cwt,i)≥1-Rt,lwt,f∈LDt},表示为LCFt,i={lcwt,1,lcwt,2,lcwt,3…lcwt,j},i∈{1,2,3…n},其对应的权重向量LCVt,i由CFt中对应长期特征词项的权重构成,表示为LCVt,i={lcvt,1,lcvt,2,lcvt,3…lcvt,j}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东理工大学,未经华东理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710441705.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种播放歌曲的系统
- 下一篇:舆情信息动态监控方法





