[发明专利]文本数据处理方法、装置、电子设备及存储介质有效
申请号: | 201910873641.0 | 申请日: | 2019-09-17 |
公开(公告)号: | CN110781273B | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 姜楠;田芳;李进;万涛;黄伟 | 申请(专利权)人: | 华东交通大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 深圳市智圈知识产权代理事务所(普通合伙) 44351 | 代理人: | 苗燕 |
地址: | 330013 江西*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 数据处理 方法 装置 电子设备 存储 介质 | ||
本申请实施例公开了一种文本数据处理方法、装置、电子设备及存储介质,该方法包括:获取待分类文本数据,从中提取方面特征词,获取待分类文本数据的文本词向量表示以及方面特征词的方面特征词向量表示,并分别输入目标神经网络,得到文本词向量表示的第一隐藏层含义和方面特征词向量表示的第二隐藏层含义,基于第一隐藏层含义和第二隐藏层含义,得到方面特征词的目标分类特征,根据方面特征词的目标分类特征,获取方面特征词的预测情感极性,根据预测情感极性对待分类文本数据进行情感分类,以得到方面特征词对应的情感分类结果并显示。本申请基于注意力机制和神经网络对方面特征词的情感极性实现了准确判断。
技术领域
本申请涉及自然语言处理技术领域,更具体地,涉及一种文本数据处理方法、装置、电子设备及存储介质。
背景技术
情感分析是自然语言处理中的一项基本任务,可以用来挖掘用户的意见,进行数据分析、舆情监控等任务。情感分析又可分为情感信息的抽取、情感信息的分类以及情感信息的检索与归纳。其中,情感分类是指根据文本所表达的含义和情感信息将文本划分成褒扬的或贬义的两种或几种类型,是对文本作者倾向性和观点、态度的划分。但一个句子针对不同方面可能涉及多种不同的情感,目前在对包含多种情感或多个方面的文本进行情感分类时,存在局限性。
发明内容
本申请提出了一种文本数据处理方法、装置、电子设备及存储介质,以改善上述缺陷。
第一方面,本申请实施例提供了一种文本数据处理方法,所述方法包括:获取待分类文本数据;从所述待分类文本数据中提取方面特征词;获取所述待分类文本数据的文本词向量表示以及所述方面特征词的方面特征词向量表示;将所述文本词向量表示和所述方面特征词向量表示分别输入目标神经网络,得到所述文本词向量表示的第一隐藏层含义和所述方面特征词向量表示的第二隐藏层含义,其中,所述目标神经网络被预先训练,用于根据输入的词向量表示,输出所述词向量表示的隐藏层含义;基于所述第一隐藏层含义和所述第二隐藏层含义,得到所述方面特征词的目标分类特征;根据所述方面特征词的目标分类特征,获取所述方面特征词的预测情感极性;根据所述预测情感极性对所述待分类文本数据进行情感分类,以得到所述方面特征词对应的情感分类结果并显示。
第二方面,本申请实施例还提供了一种文本数据处理装置,所述装置包括:文本获取模块,用于获取待分类文本数据;文本提取模块,用于从所述待分类文本数据中提取方面特征词;表示获取模块,用于获取所述待分类文本数据的文本词向量表示以及所述方面特征词的方面特征词向量表示;网络学习模块,用于将所述文本词向量表示和所述方面特征词向量表示分别输入目标神经网络,得到所述文本词向量表示的第一隐藏层含义和所述方面特征词向量表示的第二隐藏层含义,其中,所述目标神经网络被预先训练,用于根据输入的词向量表示,输出所述词向量表示的隐藏层含义;目标分类模块,用于基于所述第一隐藏层含义和所述第二隐藏层含义,得到所述方面特征词的目标分类特征;情感预测模块,用于根据所述方面特征词的目标分类特征,获取所述方面特征词的预测情感极性;情感分类模块,用于根据所述预测情感极性对所述待分类文本数据进行情感分类,以得到所述方面特征词对应的情感分类结果并显示。
第三方面,本申请实施例还提供了一种电子设备,包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行上述第一方面所述的方法。
第四方面,本申请实施例还提供了一种计算机可读取存储介质,计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述第一方面所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东交通大学,未经华东交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910873641.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文本匹配方法和装置、存储介质
- 下一篇:一种问答对生成的方法与装置