[发明专利]一种基于新闻评论网页的情感倾向性分析系统无效
| 申请号: | 200910086542.4 | 申请日: | 2009-06-05 |
| 公开(公告)号: | CN101593204A | 公开(公告)日: | 2009-12-02 |
| 发明(设计)人: | 高军;王腾蛟;杨冬青;陶富民;常雷 | 申请(专利权)人: | 北京大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京纪凯知识产权代理有限公司 | 代理人: | 徐 宁;关 畅 |
| 地址: | 100871北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 新闻 评论 网页 情感 倾向性 分析 系统 | ||
技术领域
本发明涉及一种数据挖掘系统,特别是关于一种基于新闻评论网页的实体情感倾向性分析系统。
背景技术
情感倾向性分析是通过对新闻材料信息进行分析和挖掘,用以获取公众舆论对某些产品、企业、政策等实体的情感倾向。这样就能更好地掌握公众对政府政策、企业动态等热点问题的情感倾向,为政府、企业的战略决策方向提供科学依据。现有的关于产品情感分析系统主要侧重于段落粒度或者句子粒度的产品评价的情感分析。此类系统主要是通过抽取新闻材料中的情感特征,利用分类或者统计的方法实现情感分析,这种方法对于情感特征抽取简单的领域相对适用。
而由于目前日益复杂的社会政治经济环境,上述分析系统对于复杂的分析实体不太适用。首先,在新闻评论和企业竞争力评论领域中,情感特征复杂多变,情感特征的抽取和用户的背景知识密切相关,对某个事件的评价和相关人物、地点、组织等背景知识密切相关,这样就很难在复杂的背景下分析出舆论对实体的情感倾向。其次,这些领域中情感分析和用户的情感立场密切相关,例如,对一个用户感觉正向的评论对另外的用户感觉可能是负向的,而对于两个对立的实体来说,对一个实体的“赞成”,可能是对另一个实体的“反对”;而对一个实体中包含的某一实体的“赞成”态度,也可能是对这个实体的“赞成”态度。这样就不能在一个统一的立场下,分析同一实体的情感倾向。
发明内容
针对上述问题,本发明的目的是提供一种根据用户提供的表示用户情感立场的参考实体和情感动词等情感分析规则,对有关新闻评论进行情感分析,得出情感倾向量化输出的基于新闻评论网页的实体情感倾向性分析系统。
为实现上述目的,本发明采取以下技术方案:一种基于新闻评论网页的实体情感倾向性分析系统,其特征在于:它包括用户输入模块、实体提取和层次关系发现模块、同层实体情感提取模块、实体特征提取模块、实体定位模块和情感输出模块;所述用户输入模块包括用户输入的新闻网页集合和情感分析规则;所述情感分析规则中包括参考实体和情感动词;所述实体提取和层次关系发现模块用于从所述新闻网页中提取有效实体,并建立实体层次关系图;所述同层实体情感提取模块在所述实体层次关系图中定位所述参考实体,利用参考实体、与参考实体同层次的有效实体和情感动词,获取新闻评论网页;通过对所述情感动词的新闻评论网页聚类,获得新闻评论网页子集和对应的情感主题;所述实体特征提取模块用于获取待测新闻评论网页中的中间实体,并输出所述中间实体的情感分析数据;所述实体定位模块中,判断所述中间实体是否存在于所述实体情感关系图中,如果所述中间实体不存在于所述实体情感关系图中,则直接在所述情感输出模块中输出所述情感分析数据,反之在所述实体情感关系图中定位所述中间实体;如果所述中间实体与所述参考实体同在一情感关系树中,则在所述情感输出模块中输出参考实体的情感分析数据,反之根据中间实体所在的新闻评论语句相同情感主题的所述新闻评论网页子集合进行相似度判定,间接获取所述参考实体的情感分析数据。
所述实体提取和层次关系发现模块中,通过表格结构处理和文本处理方法来提取所述有效实体。
所述情感关系树以所述参考实体或与参考实体同层次的有效实体为根节点,根节点之间存在所述情感主题的连接关系,通过文档聚类发现情感主题。
所述实体特征提取模块中,通过实体抽取工具获取中间实体。
所述实体特征提取模块中,通过情感分析工具得到所述中间实体的情感分析数据。
所述情感动词为表明情感倾向的动词,包括正向的和负向的动词,或带有权重的动词。
本发明由于采取以上技术方案,其具有以下优点:1、本发明通过用户提供的实体提取规则和情感特征从新闻评论网页中提取有效实体,并建立实体情感关系图,对用户的背景知识进行建模,识别实体之间和内部的层次关系,从而直接或间接的得出新闻评论网页中针对参考实体的情感分析数据,提高情感分析的正确性。2、本发明通过在实体情感关系图中定位中间实体的情感值,通过新闻网页聚类的方式,发现实体情感关系图中根节点之间不同情感主题,在情感分析中考虑用户的立场,获取针对参考实体的情感信息,提高情感分析的正确性。本发明可广泛用于国家方针政策的制定和企业战略方向的咨询工作。
附图说明
图1是本发明系统的整体结构示意图
图2是本发明利用实体情感关系图对新闻评论网页做实体情感倾向性分析的流程示意图
图3是本发明本发明实施例的实体情感关系示意图
实施方式
下面结合附图和实施例对本发明进行详细的描述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910086542.4/2.html,转载请声明来源钻瓜专利网。





