[发明专利]文本情感分析方法、装置、计算机设备及可读存储介质在审
| 申请号: | 202010906464.4 | 申请日: | 2020-09-01 |
| 公开(公告)号: | CN111930896A | 公开(公告)日: | 2020-11-13 |
| 发明(设计)人: | 孙思 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 程超 |
| 地址: | 510000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 情感 分析 方法 装置 计算机 设备 可读 存储 介质 | ||
本发明公开了文本情感分析方法、装置、计算机设备及可读存储介质,涉及情感分析技术领域,包括建立初始模型,采用训练样本对所述初始模型进行训练获取目标模型;获取待处理文本,对所述待处理文本进行预处理,获取第一处理数据;采用所述目标模型对所述第一处理数据进行情感倾向分析和情感数据提取,获得目标数据,通过目标模型使情感倾向分析与情感数据提取并行处理并在提取后进行双向调整,区别于现有技术中先分析情感倾向并基于情感倾向提取情感数据的方式,解决了现有技术分步提取的方式中情感数据的获取依赖于情感倾向,容易误差传递,分析结果的准确率较低的问题。
技术领域
本发明涉及情感分析技术领域,尤其涉及一种文本情感分析方法、装置、计算机设备及可读存储介质。
背景技术
在自然语言处理中,一项重要处理就是情感分析Sentiment Analysis,是指利用自然语言处理和文本挖掘技术,对带有情感色彩的主观性文本进行分析、处理和抽取的过程,它在内容分析以及反馈分析中,都占有很高的分析价值,通过分析研究对象的情感分布,可了解舆情,辅助预测等行为。
本发明创造的发明人在研究中发现,当前常见的情感分析方法通常是先对文本做情感类别的分类,然后根据情感的类别,标注出导致该情感类别的文本,由此提取出文本的情感倾向和原因数据,但是这种方式原因数据的获取依赖于情感倾向,这种分步提取的方式容易误差传递,即当情感倾向有偏差时,则提取的原因数据也会错误,由此造成分析结果的准确率较低。
发明内容
本发明的目的是提供一种文本情感分析方法、装置、计算机设备及可读存储介质,用于解决现有技术分步提取的方式中情感数据的获取依赖于情感倾向,容易误差传递,分析结果的准确率较低的问题。
为实现上述目的,本发明提供一种文本情感分析方法,包括:
建立初始模型,采用训练样本对所述初始模型进行训练获取目标模型;
获取待处理文本,对所述待处理文本进行预处理,获取第一处理数据;
采用所述目标模型对所述第一处理数据进行情感倾向分析和情感数据提取,获得目标数据。
进一步的,所述采用训练样本对所述初始模型进行训练获取目标模型,还包括:
采用第一神经网络对所述训练样本进行语义分析,获得第一分析数据;
基于所述第一分析数据同时采用第一提取网络和第二提取网络进行情感倾向提取和情感数据提取,获得初始情感标签和初始情感数据;
对所述初始情感标签和所述初始情感数据进行双向调整,获得用于标识情感倾向的第一标签和用于标识情感数据的第二标签;
调整第一提取网络和第二提取网络的损失权值;
将所述第一标签与所述第二标签分别与训练样本中的情感倾向标签和情感数据标签进行比对,并反向调整所述初始模型中的参数,直至完成训练,获得目标模型。
进一步的,所述对所述初始情感标签和所述初始情感数据进行双向调整,获得用于标识情感倾向的第一标签和用于标识情感数据的第二标签,包括以下:
采用第二神经网络对带有所述初始情感标签和所述初始情感数据的第一分析数据进行处理,获得第二分析数据;
采用softmax网络对所述第二分析数据处理获得第一标签;
采用sigmoid网络对所述第二分析数据处理获得第二标签。
进一步的,所述对所述待处理文本进行预处理,获取第一处理数据,包括以下:
对所述待处理文本中的字根据预设长度向量进行初始化,获得待处理文本中每个字对应的字向量;
将各个字向量集合获得第一处理数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010906464.4/2.html,转载请声明来源钻瓜专利网。





