[发明专利]文本情感分析方法和装置在审
| 申请号: | 201810105796.5 | 申请日: | 2018-02-02 |
| 公开(公告)号: | CN110134934A | 公开(公告)日: | 2019-08-16 |
| 发明(设计)人: | 张春荣 | 申请(专利权)人: | 普天信息技术有限公司 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N3/04 |
| 代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 孙清然;王琦 |
| 地址: | 100080 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 情感分析 分词 目标词 文本 方法和装置 文本情感 词向量 相似度 词性 卷积神经网络 情感极性 分析 预设 标注 分段 词汇 申请 | ||
本申请公开了一种文本情感分析方法和装置,其中方法包括:获取需要进行情感分析的文本,并获取所述文本包含的分词;对于每个所述分词,计算该分词在预设词典中的词向量,并根据该词向量,计算该分词与所述词典中其他词汇之间的相似度;标注每个所述分词的词性,将指定词性的所述分词确定为候选的情感分析目标词;利用候选的情感分析目标词的所述相似度,从所述候选的情感分析目标词中提取出所述文本对应的方面Aspect;根据所述候选的情感分析目标词和所述方面,利用分段卷积神经网络对所述文本进行情感极性分析。采用本发明,可以对文本进行有效、精准地情感分析。
技术领域
本发明涉及计算机应用技术,特别是涉及一种文本情感分析方法和装置。
背景技术
文本情感分析是指对具有人为主观情感色彩文本材料进行处理、分析和推理的过程。文本情感分析主要的应用场景是对用户关于某个主题的评论文本进行处理和分析。比如,人们在打算去一个餐馆吃饭之间之前,通常会去看网上关于餐馆的评论,再决定是否去这个餐馆吃饭。文本情感分析也是当前网络舆情分析(例如′产品评价′数据挖掘)等领域的重要任务,需要对文本中用户表达的观点、喜好等情感极性进行判断。这些带有情感极性的主观性文本主要是指用户对产品、餐馆或者服务的评论,这些评论可以对潜在的消费者在购买产品、进行消费和服务时提供决策依据。
目前,针对情感信息文本有多个层面的解析如篇章级、段落级、句子级、词语级。文本情感倾向分析主要有两大类方法:第一种是基于情感词典的方法;第二种是基于机器学习的方法。前者需要用到情感词典(中文的情感词典主要有中国知网发布的HowNet和台湾大学NTUSD两个情感词典),计算的方法计算普通词语与种子词语的相似度,然后判断句子的情感倾向。第二种是基于机器学习的方法,利用机器学习算法进行文本情感信息分类、文本情感信息抽取、文本情感信息分析等。鉴于互联网发展的日趋成熟,大数据时代要求更加细致而精准地对网络文本进行多方面的情感分析,做到对情感词语的多方面精准归类,从而把握无论是对短句还是长文的情感倾向。
文本情感分析对挖掘用户潜在的需求和改善产品及服务都有极大的帮助,但是这些评论每天都在大量地增长,依靠人工对其分析不但成本高、而且时间上也存在滞后性,因此需要使用合适的智能算法分析这些文本的情感极性。
如图1所示,现有的多方面文本情感分析方案通常分为三个步骤进行:①对评论对象的方面(Aspect)及其对应情感词进行识别;②对识别出的评论对象的多个方面进行情感极性分析,即将情感词的极性依据事先定义的情感值进行分类,例如分类为正向极性或负向极性;③对分类结果进行汇总(聚集)。
现有的多方面文本情感分析方案通常存在下述问题:
首先,情感分析很难进行细粒度的情感分析。目前很多方法是针对句子级别或者篇章级别的情感分析,很难分析句子内部多方面相互冲突的情况。而用户评论,不仅仅是单一的评论,例如对餐馆的评论可能包括食物、服务、地点、环境等等多方面(Aspect)的评论。这些多方面的评论中可能包含相互冲突的多方面情感,例如一个用户对餐馆的评价可能是“某某餐馆的食物很好,但是服务很差...”,针对这种一个句子里包含相互冲突的多方面情感,基于子级别或者篇章级别的情感分析,无法对其进行有效、精准的情感分类挖掘。
其次,针对网络短评,这种大都为非正式场合的短文本语料,在只考虑正面倾向和负面倾向的情况下,实现文本倾向性的分类。由于短文本噪声大、新词多、缩写频繁、有自己的固定搭配、上下文信息有限,做分词歧义明显,利用上述现有的多方面文本情感分析方案,实现文本倾向性的分类,往往得到的是不好的切分。
发明内容
有鉴于此,本发明的主要目的在于提供一种文本情感分析方法和装置,可以对文本进行有效、精准地情感分析。
为了达到上述目的,本发明提出的技术方案为:
一种文本情感分析方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普天信息技术有限公司,未经普天信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810105796.5/2.html,转载请声明来源钻瓜专利网。





