[发明专利]一种文本情感分类方法及系统有效

专利信息
申请号: 201210154332.6 申请日: 2012-05-17
公开(公告)号: CN102682130A 公开(公告)日: 2012-09-19
发明(设计)人: 李寿山;张小倩;周国栋 申请(专利权)人: 苏州大学
主分类号: G06F17/30 分类号: G06F17/30;G06F17/27
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 常亮;李辰
地址: 215123 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文本 情感 分类 方法 系统
【说明书】:

技术领域

发明涉及自然语言处理技术及模式识别领域,更具体地说,涉及一种文本情感词分类方法及系统。

背景技术

随着互联网应用的普遍发展,互联网(如博客、论坛等)上产生了大量的用户参与的,对于人物、事件、产品等的评论信息,这些评论信息表达了用户的各种情感色彩和情感倾向性,这不仅为商家提供了一个信息展示的平台,也为消费者(即用户)提供了产品使用体验交流的平台。如何从这些海量文本中提取这一类带有情感的文本,并对其进行文本情感的分析和研究,具有很强的应用价值,例如,用户可以根据商品的评论了解商品的信息,选择合适产品;商家根据用户的评论改进商品的品质,争取更大的市场等。

所谓文本情感分析,就是借助计算机帮助用户快速获取、整理和分析相关评价信息,对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程,其中,文本情感分类是文本情感分析的一项基本任务,文本情感分类是指将文本分为正面文本或者负面文本,例如,“我很喜欢这个产品”,通过情感分类,这句话将被分为正面文本,而“这本书实在太差了”,将被分类为负面文本。

现有的文本情感分类方法是基于机器学习的分类方法,该方法将人工标注的一定规模的正面文本和负面文本作为训练样本,通过对待分类文本中正面情感词和负面情感词进行统计计数,根据待分类文本中,正面情感词和负面情感词的统计情况对文本进行分类,这种文本情感分类方法实现简单,但其分类效果差,例如“我不喜欢这个产品”这句话中,包括一个正面情感词“喜欢”,应用现有的文本分类方法,很可能将这句话分为正面文本,但是这句话的整体情感极性却是负面的,因此,通过情感词统计计数的方法得到的分类结果的正确率低。

发明内容

本发明的目的是提供一种文本情感分类方法,已解决现有的文本情感分类方法分类结果的正确率低的问题。

为实现上述目的,本发明提供了如下技术方案:

一种文本情感分类方法,包括:

参考预置的情感词表,在待分类文本中查找情感词,并确定与所述情感词对应的情感极性;

使用两个极性转变规则判断所述情感词是否发生极性转变,所述两个极性转变规则包括:基于句子内结构的极性转变规则和基于句子间转折结构的极性转变规则;

计算所述待分类文本中各个中性词出现在每一种类别的文本中的概率,并依据所述情感词的情感极性及所述情感词的极性转变结果,计算所述待分类文本中各个情感词出现在每一种极性的文本中的概率;

依据所述待分类文本中各个中性词即各个情感词出现在每一种极性的文本中的概率,利用贝叶斯分类器模型对所述待分类文本进行分类。

上述方法,优选的,所述基于句子内结构的极性转变规则包括:

基于否定结构的极性转变规则,基于模态结构的极性转变规则和基于隐含结构的极性转变规则。

上述方法,优选的,所述基于否定结构的极性转变规则包括:

若所述情感词所在的句子中出现了预设的否定结构的关键词,则所述情感词发生极性转变。

上述方法,优选的,所述基于模态结构的极性转变规则包括:

若所述情感词所在的句子中,在所述情感词的前边出现了预设的模态结构的关键词,则所述情感词发生极性转变。

上述方法,优选的,所述基于隐含结构的极性转变规则包括:

若所述情感词所在的句子中出现预设的隐含结构的关键词,则所述情感词发生极性转变。

上述方法,优选的,所述基于句子间转折结构的极性转变规则包括:

若所述情感词所在的句子的后一句或后一段文本中出现预设的转折结构的关键词,则所述情感词发生极性转变。

上述方法,优选的,所述计算所述待分类文本中各个中性词出现在每一种类别的文本中的概率,并依据所述情感词的情感极性及所述情感词的极性转变结果,计算所述待分类文本中各个情感词出现在每一种类别的文本中的概率包括:

P(wk|ci)=α·Pe(wk|ci)+(1-α)·Pf(wk|ci),

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210154332.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top