[发明专利]一种基于文本相似度的事件情感分类方法有效
| 申请号: | 201810642911.2 | 申请日: | 2018-06-21 |
| 公开(公告)号: | CN108959479B | 公开(公告)日: | 2022-03-25 |
| 发明(设计)人: | 辛如意 | 申请(专利权)人: | 成都睿码科技有限责任公司;杭州数峰科技有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35 |
| 代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 廖慧敏 |
| 地址: | 610000 四川省成都市中国(四川)自*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 文本 相似 事件 情感 分类 方法 | ||
本发明公开一种基于文本相似度的事件情感分类方法,包括以下操作步骤:S000、设整个待处理事件的情感值为S;S001、选取并生成单文本情感分类模型;S002、根据余弦相似度将文本聚类;S003、设置事件的分割参数;S004、针对每一个事件类event,按照声量值分类选择文本判断分析;S005、将事件类中所有文本向量进行均值运算,生成该类的均值向量,将均值向量输入到应用模型model中,输出均值向量情感值p_avg;S006、事件内部存在情感倾向的文本,计算其情感值;S007、利用情感分类模型对事件情感值进行计算;S008、判断事件情感分类。本技术方案可针对大量文本进行监测分析,且减少人工参数,快速判断出事件的情感分类,从而达到对舆情进行监测的目的。
技术领域
本发明涉及自然语言处理技术领域,具体涉及一种基于文本相似度的事件情感分类方法。
背景技术
伴随着计算机的日益普及和互联网的迅速发展,网络已成为许多领域的用户发表和反馈个人观点、评论的主要途径。这些共享的评论信息不仅为用户提供了产品使用体验交流的平台,也可以作为其他用户使用产品前的借鉴。但是,网络中的这些评论信息量非常大,如果对每一条评论信息都人工阅读分析评论好坏,会浪费用户大量的时间。因此,如何让用户在短时间内就能够客观的了解某个产品的评论信息所反映出的总体评价好坏情况,即对网络中的评论文本进行情感分析分类,是非常必要的。
文本情感分析,就是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。文本情感分类是利用底层情绪信息抽取的结果将情感文本分为了若干类别,例如分为褒贬两类。而目前针对情感分析的技术是基于单个文本的,所有模型都是预测单个文本的情感倾向,如正向、负向或中性。面对海量的数据,人工是很难保证所有的热点都被监测到,且人工监测时监测工作量大,很难开展对单独的某部分文本进行监测。
基于此,提供一种基于文本相似度的事件情感分类方法。
发明内容
本发明所要解决上述技术问题之一:人工在处理海量数据时,处理量大,很难保证将所有热点都监测到,存在监测量大的问题,本技术方案提供一种基于文本相似度的事件情感分析方法,本方法首先计算出事件event情感值,获得单个文本情感分类模型,然后根据余弦相似度、文本情感倾向等判断事件情感分类,从而分析出情感的种类。
本发明通过下述技术方案实现:
一种基于文本相似度的事件情感分析方法,包括以下操作步骤,
S000、设整个待处理事件的情感值为S,设情感分界值分别为S1、S2;
S001、选取并生成单文本情感分类模型model,情感类别为正面、中立、负面;
S002、根据余弦相似度将文本聚类,聚合成不同的事件类;
S003、设置事件的分割参数limit-num,用来控制事件中的文本切割参数;
S004、针对每一个事件类event,按照声量值选择文本,然后判断分析;
S005、将事件类中所有文本向量进行均值运算,生成该类的均值向量,将均值向量输入到应用模型model中,输出均值向量情感值p_avg;
S006、事件内部存在情感倾向的文本,计算情感值;
S007、利用情感分类模型对事件情感值进行计算(综合w1,w2),其中,w1+w2=1;
S008、判断事件情感分类s=p(event),若s≥s2,则事件为正向;若s1ss2,则事件为中立;若s≤s1,则事件为负向。
这里用S表示事件event情感分类,s1、S2表示情感分界值,通过比较S与s1、S2的差值大小来确定该事件情感属于正面、负面、中性中的哪一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都睿码科技有限责任公司;杭州数峰科技有限公司,未经成都睿码科技有限责任公司;杭州数峰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810642911.2/2.html,转载请声明来源钻瓜专利网。





