[发明专利]针对文本数据进行情感分析的方法、装置及相关设备有效

专利信息
申请号: 202110630940.9 申请日: 2021-06-07
公开(公告)号: CN113255368B 公开(公告)日: 2021-11-05
发明(设计)人: 代文文 申请(专利权)人: 中国平安人寿保险股份有限公司
主分类号: G06F40/30 分类号: G06F40/30;G06F40/216;G06F16/35;G06F40/284
代理公司: 深圳国新南方知识产权代理有限公司 44374 代理人: 周雷
地址: 518000 广东省深圳市福田区益田路5033号*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 针对 文本 数据 进行 情感 分析 方法 装置 相关 设备
【说明书】:

发明公开了一种针对文本数据进行情感分析的方法,应用于语义识别技术领域,用于解决通过现有的分类模型对短文本情感分析的分析结果的准确性较低的问题。本发明提供的方法包括:接收到情感标签的待识别文本时,将待识别文本转换为字序列;判断该字序列包含的字数是否小于预设值,若是,则判断对应的待识别文本的情感标签为中性,否则,获取关键字词表;判断该词表的关键字中是否包含有该字序列中的词语,若是,则将对应关键字的情感标签确定为所述待识别文本的情感标签,否则,通过预先训练好的情感预测模型对所述字序列进行预测,将预测出的正情感标签的概率和负情感标签的概率中的较大值对应的情感标签确定为所述待识别文本的情感标签。

技术领域

本发明涉及语义识别技术领域,尤其涉及针对文本数据进行情感分析的方法、装置、计算机设备及存储介质。

背景技术

情感分析指的是利用机器学习与自然语言处理技术自动对包含主观信息的文本进行情感倾向性判断。情感分析常见的任务是情感分类,一般会给主观文本打上情感标签,常用的情感三分类标签分为正面、负面、中性。情感分析可为口碑分析(常见的电商产品评论、大众点评、豆瓣点评都属于此类)、微博热点话题监控、舆情分析平台等应用提供基础技术支持。

情感分类作为一个经典的分类任务,常用方法基本上可以分为两大类:

1)基于规则的分类方法。该分类方法的原理是采用为类别集合的每个类别确定分类规则,然后根据类别模板统计待分类文本,确定该文本所属类别。

2)基于统计的分类方法。该分类方法的原理是使用分类模型根据训练集中的信息自动学习,将训练集中的样本数据进行分词或分句,然后进行特征提取,从而构造出文本特征和类别之间的对应关系模型,在需要对待预测的文本进行情感预测时,利用训练好的模型对待分类文本进行分类。

发明人意识到目前已有的情感分析方案主要是针对电商产品或者各类服务进行情感倾向性分析,现有的开源语料和方法主要是面向电商和电影评论领域,观点倾向比较明显,文本一般较长,通过传统机器学习分类算法可以很直观地判断情感倾向。但对于社交领域的聊天文本,比如产品沟通群聊天反馈,基于已有的语料训练的传统情感分类模型效果一般较差,主要是因为待识别文本数据偏短时,一般不包含明显的情感词,表述也比较口语化。

基于上述第(1)种方式中情感规则的分类方法只适用于包含情感词的文本,该方法不具有通用性。上述第(2)种方式中基于传统机器学习分类算法对数据集的规模有一定的要求,适用于具有一定长度的具有上下文语义的文本语句的情感预测,发明人在实验的过程中发现,由于短文本包含的词语较少,对短文本词语进行词向量特征提取后,该词向量特征表征出的信息量也较少,通过现有的分类模型对短文本情感分析效果很差,对短文本情感分析的分析结果的准确性较低。

发明内容

本发明实施例提供一种针对文本数据进行情感分析的方法、装置、计算机设备及存储介质,以解决通过现有的分类模型对短文本情感分析效果很差、对短文本情感分析的分析结果的准确性较低的问题。

一种针对文本数据进行情感分析的方法,所述方法包括:

接收到情感标签的待识别文本时,将所述待识别文本转换为字序列;

判断所述字序列包含的字数是否小于预设值,若是,则判断对应的待识别文本的情感标签为中性;

当所述字序列包含的字数大于等于所述预设值时,获取预先构建的携带有情感标签的关键字词表;

判断所述词表的关键字中是否包含有所述字序列中的词语,若是,则将对应关键字的情感标签确定为所述待识别文本的情感标签;

当所述关键字词表中不包含所述字序列中的词语时,通过预先训练好的情感预测模型对所述字序列进行预测,得到与所述字序列相对应的正情感标签的概率和负情感标签的概率;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110630940.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top