[发明专利]情感分析方法、系统、计算机终端及存储介质在审
申请号: | 201910927228.8 | 申请日: | 2019-09-27 |
公开(公告)号: | CN110705300A | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 陈烨;胡祎;赵双喜;曹蒙蒙 | 申请(专利权)人: | 上海烨睿信息科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/247 |
代理公司: | 11463 北京超凡宏宇专利代理事务所(特殊普通合伙) | 代理人: | 谢玲 |
地址: | 200050 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标对象 文本内容 词向量 分词处理 情感分析 分析 人工智能领域 计算机终端 存储介质 计算分析 情感词典 情感倾向 分词 优化 字典 文本 概率 | ||
本发明实施例涉及人工智能领域,公开了一种情感分析方法、系统、计算机终端及存储介质,该方法包括获取待分析文本内容,识别待分析文本内容中的目标对象;对待分析文本内容进行分词处理;将分词处理得到的词输入预训练的分词字典,得到对应每个词的词向量;采用情感词典优化词向量;将目标对象和优化后的词向量输入情感分析模型,计算得到待分析文本内容针对目标对象的情感倾向概率;该方法可以高效准确地计算分析结果,能实现较好地提取和判断文本对于目标对象的情感,适用性强。
技术领域
本发明涉及人工智能领域,尤其涉及一种情感分析方法、系统、计算机终端及存储介质。
背景技术
新闻是大多数人了解这个世界变化的有力途径,通过分析目标公司相关新闻中的情感倾向,公司可以知道大众对自己的喜恶风向,股民也可以通过公司舆情来辅助判断是否该买入和卖出股票。在各大门户网站的众多新闻中,如何通过技术手段准确地提取新闻中目标公司以及判断新闻中内容对目标公司是否利好,成为一个需要解决的问题。目前市场中的情感分析方案多采用基于规则词典或纯模型方式,针对的是文本整体的情感而不是针对目标的情感。这种方式存在正确率不高的问题,如标注的财经领域数据测试百度情感分析接口,正确率不到7成。
发明内容
本发明的目的在于针对现有技术的上述问题,提供一种情感分析方法、系统、计算机终端及存储介质用于解决现有技术的不足。
具体地,本发明提供了一种情感分析方法,包括:
获取待分析文本内容,识别所述待分析文本内容中的目标对象;
对所述待分析文本内容进行分词处理;
将分词处理得到的词输入预训练的分词字典,得到对应每个词的词向量;
采用情感词典优化所述词向量;
将所述目标对象和优化后的词向量输入情感分析模型,计算得到所述待分析文本内容针对所述目标对象的情感倾向概率。
作为上述技术方案的进一步改进,所述方法还包括:
建立针对所述目标对象的目标词典,采用所述目标词典筛选包括所述目标对象的名称的文本内容作为待分析文本集;
计算所述待分析文本集中每一条待分析文本中针对所述目标对象的情感倾向概率,得到情感倾向概率集;
根据所述情感倾向概率集确定所述待分析文本集针对所述目标对象的情感倾向。
作为上述技术方案的进一步改进,所述方法还包括:
为所述目标对象分配一个标识,所述识别所述待分析文本内容中的目标对象后用所述标识替换文本内容中的所述目标对象。
作为上述技术方案的进一步改进,所述采用情感词典优化所述词向量包括:
利用所述情感词典在通过所述计算得到的词向量中添加一个包括三个情感级别的情感类型维度,所述情感级别包括正面情感级别、负面情感级别、和中性情感级别;
利用所述词向量中相应情感级别的预设情感分数值调整所述词向量。
作为上述技术方案的进一步改进,所述识别所述待分析文本内容中的目标对象包括:
将所述待分析文本内容输入预先训练好的实体识别模型,所述实体识别模型将所述待分析文本内容分为若干个字符,为每个字符分配初始向量,按照从前往后的第一顺序和从后往前的第二顺序同时计算各字符在文本中出现位置的相应概率,根据该概率确定各字符在文本内容中的位置,根据该位置识别出由字符组成的目标对象。
作为上述技术方案的进一步改进,所述计算得到所述待分析文本内容中针对目标对象的情感倾向概率包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海烨睿信息科技有限公司,未经上海烨睿信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910927228.8/2.html,转载请声明来源钻瓜专利网。