[发明专利]针对文本数据进行情感分析的方法、装置及相关设备有效
| 申请号: | 202110630940.9 | 申请日: | 2021-06-07 |
| 公开(公告)号: | CN113255368B | 公开(公告)日: | 2021-11-05 |
| 发明(设计)人: | 代文文 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/216;G06F16/35;G06F40/284 |
| 代理公司: | 深圳国新南方知识产权代理有限公司 44374 | 代理人: | 周雷 |
| 地址: | 518000 广东省深圳市福田区益田路5033号*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 针对 文本 数据 进行 情感 分析 方法 装置 相关 设备 | ||
本发明公开了一种针对文本数据进行情感分析的方法,应用于语义识别技术领域,用于解决通过现有的分类模型对短文本情感分析的分析结果的准确性较低的问题。本发明提供的方法包括:接收到情感标签的待识别文本时,将待识别文本转换为字序列;判断该字序列包含的字数是否小于预设值,若是,则判断对应的待识别文本的情感标签为中性,否则,获取关键字词表;判断该词表的关键字中是否包含有该字序列中的词语,若是,则将对应关键字的情感标签确定为所述待识别文本的情感标签,否则,通过预先训练好的情感预测模型对所述字序列进行预测,将预测出的正情感标签的概率和负情感标签的概率中的较大值对应的情感标签确定为所述待识别文本的情感标签。
技术领域
本发明涉及语义识别技术领域,尤其涉及针对文本数据进行情感分析的方法、装置、计算机设备及存储介质。
背景技术
情感分析指的是利用机器学习与自然语言处理技术自动对包含主观信息的文本进行情感倾向性判断。情感分析常见的任务是情感分类,一般会给主观文本打上情感标签,常用的情感三分类标签分为正面、负面、中性。情感分析可为口碑分析(常见的电商产品评论、大众点评、豆瓣点评都属于此类)、微博热点话题监控、舆情分析平台等应用提供基础技术支持。
情感分类作为一个经典的分类任务,常用方法基本上可以分为两大类:
1)基于规则的分类方法。该分类方法的原理是采用为类别集合的每个类别确定分类规则,然后根据类别模板统计待分类文本,确定该文本所属类别。
2)基于统计的分类方法。该分类方法的原理是使用分类模型根据训练集中的信息自动学习,将训练集中的样本数据进行分词或分句,然后进行特征提取,从而构造出文本特征和类别之间的对应关系模型,在需要对待预测的文本进行情感预测时,利用训练好的模型对待分类文本进行分类。
发明人意识到目前已有的情感分析方案主要是针对电商产品或者各类服务进行情感倾向性分析,现有的开源语料和方法主要是面向电商和电影评论领域,观点倾向比较明显,文本一般较长,通过传统机器学习分类算法可以很直观地判断情感倾向。但对于社交领域的聊天文本,比如产品沟通群聊天反馈,基于已有的语料训练的传统情感分类模型效果一般较差,主要是因为待识别文本数据偏短时,一般不包含明显的情感词,表述也比较口语化。
基于上述第(1)种方式中情感规则的分类方法只适用于包含情感词的文本,该方法不具有通用性。上述第(2)种方式中基于传统机器学习分类算法对数据集的规模有一定的要求,适用于具有一定长度的具有上下文语义的文本语句的情感预测,发明人在实验的过程中发现,由于短文本包含的词语较少,对短文本词语进行词向量特征提取后,该词向量特征表征出的信息量也较少,通过现有的分类模型对短文本情感分析效果很差,对短文本情感分析的分析结果的准确性较低。
发明内容
本发明实施例提供一种针对文本数据进行情感分析的方法、装置、计算机设备及存储介质,以解决通过现有的分类模型对短文本情感分析效果很差、对短文本情感分析的分析结果的准确性较低的问题。
一种针对文本数据进行情感分析的方法,所述方法包括:
接收到情感标签的待识别文本时,将所述待识别文本转换为字序列;
判断所述字序列包含的字数是否小于预设值,若是,则判断对应的待识别文本的情感标签为中性;
当所述字序列包含的字数大于等于所述预设值时,获取预先构建的携带有情感标签的关键字词表;
判断所述词表的关键字中是否包含有所述字序列中的词语,若是,则将对应关键字的情感标签确定为所述待识别文本的情感标签;
当所述关键字词表中不包含所述字序列中的词语时,通过预先训练好的情感预测模型对所述字序列进行预测,得到与所述字序列相对应的正情感标签的概率和负情感标签的概率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110630940.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种短期负荷预测方法及系统
- 下一篇:一种基于超声换能的检测系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





