[发明专利]一种文本情感分析方法、装置、电子设备及存储介质有效
| 申请号: | 202110571174.3 | 申请日: | 2021-05-25 |
| 公开(公告)号: | CN113221534B | 公开(公告)日: | 2023-06-16 |
| 发明(设计)人: | 黄文清 | 申请(专利权)人: | 深圳和锐网络科技有限公司 |
| 主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/242;G06F40/284;G06F40/289 |
| 代理公司: | 深圳驿航知识产权代理事务所(普通合伙) 44605 | 代理人: | 杨伦 |
| 地址: | 518000 广东省深圳市宝安*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文本 情感 分析 方法 装置 电子设备 存储 介质 | ||
本发明实施例提供一种文本情感分析方法、装置、电子设备及存储介质,所述方法包括:获取文本数据并进行预处理;对所述预处理后的文本数据进行分词处理和分字处理,并将处理结果分别输入预训练的词转向量模型,得到词向量和字向量;基于所述词向量和所述字向量获取第一情感方向和第二情感方向;将所述词向量和所述字向量进行融合,得到融合向量,并基于所述融合向量得到第三情感方向;基于所述第一情感方向、第二情感方向和第三情感方向确定文本的情感倾向。可以全面地、细粒度地利用文本情感数据,提高文本情感分析的准确率。
技术领域
本发明涉及计算机情感分析技术领域,尤其涉及一种文本情感分析方法、装置、电子设备及存储介质。
背景技术
随着互联网、特别是移动互联网的迅速发展,各种新应用不断产生,例如新闻门户网站、电子商务网站、社交网络等。在这些应用上,普通大众可以表达对事物的主观倾向性观点,例如对新闻事件的评论,以及对所购买商品的喜好。目前,由用户生成的带有情感倾向性的文本数据以指数增长。通过挖掘这些海量数据,获取用户情感信息,对电子商务、商业智能、民意调查、舆情分析、情报分析、企业管理等至关重要,也为管理者提供强有力的决策支持。例如,商家可以通过这些信息获取消费者意见,更好地理解消费者的喜好与消费习惯,设计生产出更有针对性的产品;政府机构可以通过分析热点事件的舆情,为指定方针政策提供依据;而普通消费者则可以依据其他人的观点汇总作为其购买行为以及消费决策的重要参考。
当前现有技术常见的情感分析方法,文本信息的获取和构建不全面,数据量不够大,且是基于句子级别的粗粒度的情感分析方法,对文本上下文信息的表示和利用也存在差距,难以细粒度辨别上下文情感信息,导致情感分析不够准确。
发明内容
本发明实施例提供一种文本情感分析方法,能够提高文本情感分析的准确度。
第一方面,本发明实施例提供一种文本情感分析方法,包括以下步骤:
获取文本数据并进行预处理;
对所述预处理后的文本数据进行分词处理和分字处理,并将处理结果分别输入预训练的词转向量模型,得到词向量和字向量;
基于所述词向量和所述字向量获取第一情感方向和第二情感方向;
将所述词向量和所述字向量进行融合,得到融合向量,并基于所述融合向量得到第三情感方向;
基于所述第一情感方向、第二情感方向和第三情感方向确定文本的情感倾向。
可选的,所述获取文本数据并进行预处理,包括:
通过爬虫从互联网上获取文本数据;
对所述文本数据进行去重处理。
可选的,所述对所述预处理后的文本数据进行分词处理和分字处理,包括:
将所述预处理后的文本数据输入到大数据处理平台进行分词处理和分字处理,得到分词处理结果和分字处理结果。
可选的,所述词转向量模型包括CBOW结构的word2vec模型,所述将处理结果分别输入预训练的词转向量模型,得到词向量和字向量,包括:
获取所述CBOW结构的word2vec模型的词窗;
调整所述词窗大小,并通过所述词窗分别将所述分词处理结果和分字处理结果输入所述CBOW结构的word2vec模型,对应得到所述词向量和所述字向量。
可选的,基于所述词向量和所述字向量获取第一情感方向和第二情感方向的步骤包括:
获取情感分析词典;
根据所述情感分析词典从所述词向量和所述字向量中分别获取对应的第一情感方向和第二情感方向。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳和锐网络科技有限公司,未经深圳和锐网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110571174.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电动叉车货叉能效在线监测系统
- 下一篇:一种水性吸塑胶及其制备方法





