[发明专利]文本情感分析方法、装置、存储介质及处理器有效
申请号: | 201811159908.1 | 申请日: | 2018-09-30 |
公开(公告)号: | CN110969011B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 韩旭红 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/289 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 薛娇;王宝筠 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 情感 分析 方法 装置 存储 介质 处理器 | ||
1.一种文本情感分析方法,其特征在于,包括:
在待分析文本中识别用于表征待分析的目标视角的词,作为目标视角词;
根据所述目标视角词,对所述待分析文本进行统计分析,以判断所述待分析文本整体在所述目标视角的情感类别是否为中性,和/或,判断所述待分析文本中包含目标视角词和/或所述目标视角词的表述词的语句在所述目标视角的情感类别是否为中性;
若至少一个判断结果均为否,则在所述待分析文本中未确定在所述目标视角的情感类别的语句中确定目标语句,并在所述目标语句中提取特征序列;
将所述特征序列输入预先训练好的语句情感分析模型,得到所述目标语句在所述目标视角的情感类别;
将所有在所述目标视角确定情感类别的语句的情感类别合并,得到所述待分析文本在所述目标视角的情感类别;
所述根据所述目标视角词,对所述待分析文本进行统计分析,包括:
若所述待分析文本的标题中不包含所述目标视角词以及所述目标视角词的表述词,所述待分析文本的正文的语句数大于第一预设阈值,且正文中包含所述目标视角词和/或所述目标视角词的表述词的语句的数量小于第二预设阈值,确定所述待分析文本整体在所述目标视角的情感类别为中性;
若所述待分析文本整体在所述目标视角的情感类别不为中性,统计所述待分析文本中包含所述目标视角的第一语句包含的视角的数量;若视角的数量大于第三预设阈值,确定所述第一语句在所述目标视角的情感类别为中性;
所述在所述待分析文本中未确定在所述目标视角的情感类别的语句中确定目标语句,包括:
若所述待分析文本中仅包含所述目标视角词和/或所述目标视角词的表述词,且包含所述目标视角词和/或所述目标视角词的表述词的语句的数量小于第四预设阈值,那么,若包含所述目标视角词和/或所述目标视角词的表述词的语句包括所述待分析文本的标题,且所述待分析文本的正文的语句数小于第五预设阈值,将所述待分析文本的正文中,所有未确定在所述目标视角的情感类别的语句均作为目标语句。
2.根据权利要求1所述的方法,其特征在于,所述在所述目标语句中提取特征序列包括:
对所述目标语句进行分词处理,得到多个分词;
基于所述多个分词构建特征序列,所述特征序列中包括:各个分词、各个分词对应的词性、各个分词对应的标识、目标视角词的表述词、各个分词相对所述目标视角词或所述目标视角词的表述词的位置;
所述标识包括:视角标识、属性标识、评价标识或其它标识。
3.根据权利要求1所述的方法,其特征在于,所述在所述待分析文本中未确定在所述目标视角的情感类别的语句中确定目标语句,包括:
若所述待分析文本中仅包含所述目标视角词和/或所述目标视角词的表述词,且包含所述目标视角词和/或所述目标视角词的表述词的语句的数量小于第四预设阈值,那么,若包含所述目标视角词和/或所述目标视角词的表述词的语句不包括所述待分析文本的标题,且所述待分析文本的正文的语句数小于第六预设阈值,将所述待分析文本中,长度大于第七预设阈值的未确定在所述目标视角的情感类别的语句作为目标语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811159908.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种锂离子电池
- 下一篇:具有油烟气循环系统的燃烧器及包含其的商用燃气灶