[发明专利]一种以矩阵计算为基础进行舆论信息抽取的方法及系统有效
申请号: | 201510569894.0 | 申请日: | 2015-09-09 |
公开(公告)号: | CN105117385B | 公开(公告)日: | 2017-12-19 |
发明(设计)人: | 杜登斌;杜璞 | 申请(专利权)人: | 北京中润普达信息技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京律诚同业知识产权代理有限公司11006 | 代理人: | 祁建国,梁挥 |
地址: | 100029 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 矩阵 计算 基础 进行 舆论 信息 抽取 方法 系统 | ||
技术领域
本发明涉及网络舆情领域,尤其涉及一种以矩阵计算为基础进行舆论信息抽取的方法及系统。
背景技术
随着互联网在全球范围内的飞速发展,网络媒体已被公认为是继报纸、广播、电视之后的“第四媒体”,网络成为反映社会舆情的主要载体之一。
网络舆情是通过互联网传播的,公众对现实生活中某些热点、焦点问题所持的有较强影响力、倾向性的情感、态度、意见、言论或观点,其主要通过论坛BBS上的发帖评论及跟贴、博客Blog等实现并加以强化。由于互联网具有虚拟性、隐蔽性、发散性、渗透性和随意性等特点,越来越多的网民乐意通过这种渠道来表达观点、传播思想。
网络舆情是一股强大的舆论力量,会反作用于热点事件并对社会发展和事态进程产生一定的影响。由于网络的开放性,会导致网络舆情形成迅速,对社会影响巨大。特别是当出现负面的网络新闻舆情时,若不能及时了解、有效引导,很容易形成舆论危机,严重时甚至影响公共安全。对网络新闻舆论危机的积极化解,对维护社会稳定、促进国家发展具有重要的现实意义,也是创建和谐社会的应有内涵。对网络新闻舆情观点进行收集具有相当重要的意义,在一个热点事件的发展过程中网民观点起着至关重要的作用,甚至可以被认为是网络新闻舆情的核心。
最近,随着互联网技术的迅速发展,以新闻媒体等为代表的新媒体打破信息的控制和垄断,在网络上人们自由表达自己的态度和意见,不再像过去那么容易地无条件接受,相反,不同阶层的利益诉求纷纷呈现,不同思想观点正面碰撞。对相关政府部门来说,如何及时准确的了解网络新闻舆情,加强对网络新闻舆论的及时监测、有效引导,成为网络新闻舆情管理的一大难点。在这种情况下,建设能够覆盖新闻数据源的新闻舆情监测系统十分必要,此类系统可针对新的新闻媒介传播环境,进一步深入研究新闻舆情的热点研判方法以及新媒体带来的影响,对新闻舆情研究进行丰富和完善。
虽然目前已经有很多单位针对网络新闻舆情监控提出了一些不同的解决方案。但是,需要本领域技术人员解决的技术问题是如何提高判断网络新闻舆情信息的效率和精确度。因为截至目前,尚未有较为高效、准确的针对新闻媒体数据的网络舆情监测系统。
发明内容
针对现有技术的不足,本发明提出一种以矩阵计算为基础进行舆论信息抽取的方法及系统。
本发明提出一种以矩阵计算为基础进行舆论信息抽取的方法,包括
步骤1,抓取互联网的网站信息,建立信息源矩阵,其中信息源矩阵包括信息库类型信息、信息库信息、站点信息、子站点信息、信息源统计信息、信息库权限信息、基础属性信息、文章字段信息八部分;
步骤2,建立分词矩阵、规则矩阵,分别获取所述信息源矩阵与所述分词矩阵与所述规则矩阵的权重与候选级别,用户输入用户关键词,通过分词矩阵选择所述用户关键词的所属行业,并根据所述权重与所述候选级别计算综合评分,以完成舆情分析。
所述分词矩阵将所述用户关键词可能的所属行业作为所述分词矩阵的元素,所述用户在输入所述用户关键词时,通过选择所属行业,缩小检索范围,提高效率。
所述规则矩阵包括查找网站中最能体现文章内容的关键词,进行关键词标注。
通过以下公式获取所述权重:
信息源权重计算公式:q*w*e=r,中,q为信息源类型评分,w为信息源网站重要性分级,e为是否置顶,r为信息源权重;
分词权重计算公式:x*y=u,中,x为关键词的行业特征表达度,y为关键词的敏感度,u为分词权重;
规则权重计算公式:g*h=k,中,g为规则的行业特征表达度,h为规则的情感倾向程度,k为规则权重。
计算所述综合评分的公式为:
a1*b1+…ai*bi=M
其中a为权重,b为候选级别,i为第i个权重,j为第j个候选级别,M为综合评分。
本发明还提出一种以矩阵计算为基础进行舆论信息抽取的系统,包括
建立信息源矩阵模块,用于抓取互联网的网站信息,建立信息源矩阵,其中信息源矩阵包括信息库类型信息、信息库信息、站点信息、子站点信息、信息源统计信息、信息库权限信息、基础属性信息、文章字段信息八部分;
建立分词矩阵、规则矩阵模块,用于建立分词矩阵、规则矩阵,分别获取所述信息源矩阵与所述分词矩阵与所述规则矩阵的权重与候选级别,用户输入用户关键词,通过分词矩阵选择所述用户关键词的所属行业,并根据所述权重与所述候选级别计算综合评分,以完成舆情分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中润普达信息技术有限公司,未经北京中润普达信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510569894.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:翻译方法和装置
- 下一篇:一种油棕传粉象甲成虫饲喂器