[发明专利]一种舆情信息的地域识别方法和装置有效

专利信息
申请号: 201210583484.8 申请日: 2012-12-31
公开(公告)号: CN103064951A 公开(公告)日: 2013-04-24
发明(设计)人: 史波良;李名臣;丁荟 申请(专利权)人: 南京烽火星空通信发展有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 210019 江苏省南京*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 舆情 信息 地域 识别 方法 装置
【说明书】:

技术领域

专利申请属于网络信息技术领域,特别是涉及一种舆情信息的地域识别方法和装置。

背景技术

随着因特网在全球范围内的飞速发展,网络媒体已被公认为是继报纸、广播、电视之后的“第四媒体”,网络成为反映社会舆情的主要载体之一,网络环境下的舆情信息的主要来源有:新闻评论、BBS、博客、聚合新闻。网络舆情表达快捷、信息多元、方式互动,具有传统媒体无法比拟的优势。网络的开放性和虚拟性,决定了网络舆情具有直接性、突发性、和偏差性的特点。近年来,网络舆情的影响越来越重要,众多重大舆情事件都是由网上开始爆发扩散,且大部分舆情信息都具有负面性。为了能够更准确有效的发现本地相关的舆情信息,及时对互联网不良信息进行疏导和管理,准确判定网络舆情信息所属的地区就显得尤为重要。

目前有不少地域识别方法,但是一般都仅仅提取出地名词,并没有有效的针对舆情信息的主体地区进行识别,或者仅仅通过词频来识别主体地区。在舆情信息中可能会出现多个地名,但舆情信息真正发生的地区只有一个。实际应用过程中,某地区优先关注的是本地相关的舆情信息,如南京的政府机构、企事业单位优先关心南京地区相关的舆情信息,现有的地域识别方式可能会检索到很多与南京关联不大的信息,还需要用户从大量的信息中手动筛选相关信息,降低了工作效率。

发明内容

本专利申请所要解决的技术问题是:提供一种舆情信息的地域识别方法和装置,实现对舆情信息所属地域的精准判定,弥补现有地域识别方法无法准确定位的不足。

为解决上述技术问题,本专利申请提供了一种舆情信息的地域识别方法和装置,包括文本预处理模块、地区属性词提取模块、地区权重计算模块和地区过滤模块。其中:

文本预处理模块:对包含舆情信息的文本进行分词处理;

地区属性词提取模块:加载地区属性库,对分词后的文本信息进行地区属性库匹配,获取地区属性,

构建地区属性词信息集,并按照行政区域划分地区属性词信息;

地区权重计算模块:计算各级地区属性词权重及权重比;

地区过滤模块:根据权重阈值,过滤次要信息。

本专利申请所述的一种舆情信息的地域识别方法利装置,其工作步骤如下:

(1)对包含舆情信息的文本进行中文分词,提取分词信息;

(2)加载带行政区域级别的地区属性库,对分词后的舆情信息进行地区属性库匹配,获取地区属性;

(3)构建地区属性词信息集;

(4)按照行政区域划分地区属性词信息;

(5)计算各级地区属性词的权重及权重比;

(6)根据权重阈值,滤除次要信息,准确判定舆情信息所属地域。

地区属性库是由大量经过长期调研、采集、优化而得到的信息组成的词库,包括地区词、代表建筑、地域文化词汇、地方性网站板块URL等信息,能够满足用户需求。

地区属性词信息集包括地区属性词、地区属性词在文本中的位置、地区属性词出现次数、上下文地区属性词以及间隔距离等信息。

影响权重的因素主要包括地区属性词出现位置和出现次数。

本专利申请的有益效果:

在文本内容地区属性提取的基础上,研究地区属性的相关度,从海量数据中准确筛选出相关信息,滤除次要信息,提高了舆情信息地域识别的精确度,保证了其他应用数据推送的质量。能够帮助政府部门及时掌握社会舆论,在未知舆情信息的萌发阶段就对重点区域进行识别和有效疏导;帮助企业在第一时间掌握竞争对手在特定区域的市场动态,协助企业及时制定有效的竞争策略。

附图说明

图1为本专利申请的模块分布图

图2为本专利申请的流程示意图

具体实施方式

本专利申请的模块分布情况如图1所示,包括文本预处理模块、地区属性词提取模块、地区权重计算模块和地区过滤模块。

本专利申请的舆情信息地域识别流程如图2所示,下面结合图2以及具体实施例对本专利申请进行详细描述。

步骤1:对包含舆情信息的文本进行中文分词,提取分词信息,过滤掉无关信息。

步骤2:加载带行政区域级别的地区属性库,对分词后的舆情信息进行地区属性库匹配,获取地区属性。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京烽火星空通信发展有限公司,未经南京烽火星空通信发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210583484.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top