[发明专利]基于概率特征关联的舆情分析方法在审

专利信息
申请号: 201710441705.0 申请日: 2017-06-13
公开(公告)号: CN107239562A 公开(公告)日: 2017-10-10
发明(设计)人: 程华;姚俊;马宇舸;房一泉 申请(专利权)人: 华东理工大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 常州市权航专利代理有限公司32280 代理人: 袁兴隆
地址: 200237 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 概率 特征 关联 舆情 分析 方法
【权利要求书】:

1.一种基于概率特征关联的舆情分析方法,其特征在于,包括以下步骤:

步骤一、收集某一新闻事件的长期信息,取长期信息中的长期特征词项组成文本信息的长期词典;

步骤二、取当前新闻文本信息的特征词项组成的当前特征集合;

步骤三、将长期词典与当前特征词项进行关联,以当前特征词项为中心、基于特征词项的相似度设置圆形关联门,获取当前特征词项关联门内的长期特征词项的特征集合以及该特征集合对应的权重向量;

步骤四、分别求步骤三中关联门内长期特征词项的词向量和当前特征词项的词向量,并求两者词向量间的关联概率;

步骤五、通过所述关联概率计算当前特征词项的最优特征权值,并生成当前特征集合对应的最优当前特征权值向量;

步骤六、将所述最优当前特征权值向量用于软传感器模型对当前新闻事件进行态势估计,得到当前新闻事件的态势融合估计。

2.如权利要求1所述的基于概率特征关联的舆情分析方法,其特征在于,步骤一中,使用长期词典法获取事件长期信息中的长期态势,作为用于关联融合的长期态势向量,所述长期词典由q个所述长期特征词项lwt,i构成,表示为LDt={lwt,1,lwt,2,lwt,3…lwt,q},在向量空间模型VSM空间下抽取长期词典中的特征词项权重向量,表示为LVt={lvt,1,lvt,2,lvt,3…lvt,q},其中,lwt,i对应的权重为lvt,i

3.如权利要求2所述的基于概率特征关联的舆情分析方法,其特征在于,步骤二中,t时刻所述当前特征集合由n个当前特征词项cwt,i构成,表示为CFt={cwt,1,cwt,2,cwt,3…cwt,n},在向量空间模型VSM空间下抽取当前特征集合中的特征词项权重向量,表示为CVt={cvt,1,cvt,2,cvt,3…cvt,n},其中,cwt,i对应的权重为cvt,i

4.如权利要求3所述的基于概率特征关联的舆情分析方法,其特征在于,特征词项的权重采用TF-IDF方法计算,权重表达对应特征词项在文本中的重要程度。

5.如权利要求4所述的基于概率特征关联的舆情分析方法,其特征在于,所述权重cvt,i=tfi log(M/ni+0.01),其中,tfi为特征词项cwt,i在文本信息中出现次数,M表示数据集中文本信息的总数,ni表示含有该特征词项的文本信息数。

6.如权利要求5所述的基于概率特征关联的舆情分析方法,其特征在于,步骤三中,所述关联门半径Rt为:所述特征词项cwt,i关联门内的特征集合LCFt,i为:LCFt,i={lwt,f|Similar(lwt,f,cwt,i)≥1-Rt,lwt,f∈LDt},表示为LCFt,i={lcwt,1,lcwt,2,lcwt,3…lcwt,j},i∈{1,2,3…n},其对应的权重向量LCVt,i由CFt中对应长期特征词项的权重构成,表示为LCVt,i={lcvt,1,lcvt,2,lcvt,3…lcvt,j}。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东理工大学,未经华东理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710441705.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top