[发明专利]一种基于认知评价理论的汉语文本情感识别方法无效
申请号: | 201010238370.0 | 申请日: | 2010-07-23 |
公开(公告)号: | CN101901212A | 公开(公告)日: | 2010-12-01 |
发明(设计)人: | 毛峡;易寒飞 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 认知 评价 理论 汉语 文本 情感 识别 方法 | ||
(一)技术领域
本发明涉及模式识别领域,具体涉及一种汉语文本情感识别方法。
(二)背景技术
随着互联网的飞速发展,文本信息已经成为人类最常用的交互方法之一。研究文本中蕴含的情感信息已成为人机交互领域的研究热点。文本情感信息的提取在诸如语音合成、信息安全、智能机器人、个性化文本等领域也有着广泛的应用前景。
传统的文本情感识别模型主要通过分析文本的字面特征提取句子的情感倾向,这些方法的准确率很大程度上受到情感语料库和常识库的影响,目前较为常用的汉语文本常识库有HowNet,而汉语文本情感语料库则较为匮乏。另外由于人类语言的复杂性,仅仅考虑字面特征而不区分概念之间的逻辑关系很难精确识别文本情感信息。
根据认知评价理论,情感是人们对某个其主观上认为重要的事件进行评价而产生的。在评价理论中最有影响力的是Ortony、Clore和Collins提出的OCC理论。OCC模型是第一个以计算机实现为目的发展起来的模型。OCC模型认为情感来源于人们对由事件(Event)、智能体(Agent)和对象(Object)组成的情境的认知评价。OCC理论的基本原理是:根据一组评价标准将人对特定情境的反应区分为正面或负面,然后根据评价标准的不同取值组合确定相应的情感类型。OCC模型共定义了22种情感类型。
在汉语文本情感识别方面,目前绝大多数方法仅能识别褒义和贬义两种情感极性,这对于汉语文本所表达的丰富的情感信息是远远不够的。将OCC模型应用于汉语文本情感识别,可以有效解决汉语文本情感识别领域存在的情感识别类别少,识别准确度不高等问题。因此,针对汉语文本研究一种能够准确识别多种情感的方法具有重要的现实意义。
(三)发明内容
本发明要解决的技术问题是提供一种能够准确识别多种情感的汉语文本情感识别方法。
根据本发明的一个方面,提供了一种基于认知评价理论的汉语文本情感识别方法,包括下列步骤:
1)使用自然语言处理工具对汉语文本进行预处理,得到句子成分之间的依存关系;
2)根据情感识别变量的确定方法确定句子所包含的情感识别变量并将句子成分赋值给情感识别变量;
3)根据情感识别变量的赋值方法确定情感识别变量的取值;
4)根据情感规则确定句子表达的情感类型。
在上述方法中,所述步骤3)还包括:
31)对HowNet常识库的义原添加情感极性标注,根据词语情感极性的赋值方法得到词语的情感极性。
在上述方法中,所述步骤2)中情感识别变量如表1所示。
表1情感识别变量
在上述方法中,所述步骤2)中情感识别变量的确定方法包括:
情感主体考察句子的主语部分,利用句法分析工具可以得到句子的主谓宾关系。根据主语的特征进行赋值,第一人称赋值为self,其它人称赋值为other,非人称的事物赋值为object;
主体极性考察取值为other的情感主体及其相关的定语修饰词;
事物极性考察取值为object的情感主体及其相关的定语修饰词;
事件极性和行为极性均考察句子的谓语部分和宾语部分组成的结构,其中谓语部分由谓语和状语构成,宾语部分由宾语和定语构成;
事件状态考察句子中的状语部分,采用关键词识别的方法确定取值;
自身反应考察句子中具有明显情感倾向的词语,采用关键词识别的方法确定取值。
在上述方法中,所述步骤31)中词语情感极性的赋值方法包括:
对HowNet中所有义原的极性进行标注,分为正面、负面、中性和无极性4种;
完成义原的情感极性标注后,采用下述公式得到词语的情感极性:
表示词语W的情感极性,其值为正表示正面情感,为负表示负面情感,为零表示中性情感,n表示词语W包含的义原总个数,Si表示词语W的第i个义原,Polarity(Si)表示义原Si的极性,其中正面赋值1,负面赋值-1,中性和无极性赋值为0,αi表示义原Si在词语W情感极性中的权重,主要针对HowNet中采用动态角色与特征标注的复杂词语,取值为0或1。
在上述方法中,所述步骤3)中情感识别变量的赋值方法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010238370.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于信息管理平台的系统设计原则
- 下一篇:一种激光通讯装置