[发明专利]基于上下文语义的微博短文本的情感分析方法有效

专利信息
申请号: 202110411497.6 申请日: 2021-04-16
公开(公告)号: CN113190648B 公开(公告)日: 2022-09-20
发明(设计)人: 史伟;付月;史麦可 申请(专利权)人: 湖州师范学院
主分类号: G06F16/33 分类号: G06F16/33;G06F16/31;G06F40/242;G06F40/279;G06F40/30
代理公司: 西安研创天下知识产权代理事务所(普通合伙) 61239 代理人: 梁宝龙
地址: 313000 浙江省湖州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 上下文 语义 微博短 文本 情感 分析 方法
【说明书】:

发明公开了一种基于上下文语义的微博短文本的情感分析方法,本发明提出基于情感圈的情感分析方法,对微博文本集中的每个词语构建情感圈,运用情感圈从词语所处语境的共现模式中捕获词语的潜在语义,并提出了情感圈的语义表示和情感值计算方法,通过本发明的方法使得情感检测的结果准确率更高。

技术领域

本发明涉及网络社会媒体情感分类领域,具体涉及一种基于上下文语义的微博短文本的情感分析方法。

背景技术

目前,微博成为了人们表达对各种话题的看法和态度提供了一种平民平台,因此微博情感分析方法受到广泛关注。

微博中的信息主要是以短文本的形式存在,微博短文本情感分析的方法主要集中于个体微博情感的识别(即单条微博级情感检测),而当前的微博级情感检测工作主要采用两种方法:基于机器学习的方法和基于词典的方法。

机器学习方法需要为情感分类器学习训练数据。在微博中,训练数据有些通过情感符号假设微博的极性(正面、负面和中立),有些则从情感检测网站返回的结果中获得共识。而且监督方法是领域依赖的,需要对新的数据进行重新训练。鉴于微博中不断涌现的不同的主题,领域依赖限制了这种方法的应用;反之,基于词典的方法则不需要训练数据,而是使用所有情感词汇加权来确定给定文本的整体情感倾向,这类方法通常在常规文本中能取得较准确的分析结果。然而,因为微博文本里包含大量的畸形词和口语表达(例如“ky”、“ssfd”、“猴腮雷”)Wei Shi et al(2015)构建了一种基于情感本体和语义的社交化短文本情感分析方法,叫EOSentiMiner。

虽然构建的EOSentiMiner和情感本体在相应的数据集中取得了良好的情感分析效果,但是和其它基于词典的方法类似,其中的情感本体同样面临两个主要的问题。首先EOSentiMiner的准确性召回率受限于情感本体中的固定词集,如果情感本体中没有的词语在情感分析中就很难被考虑,这在处理微博文本时会成为一个问题,因为微博中新的表达和隐语不断涌现。其次更为重要的是,EOSentiMiner提供的是固定的、上下文语境无关的情感词的极性和强度。但是在实际的很多微博文本中不同的词语在不同的上下文语境中确表现出不同的情感极性和强度。

为此,如何获取情感词极性和强度在上下文语境中的变化,并以此构建更为准确和高效的微博情感分析方法,从而得到理想的情感分类结果,是目前亟待解决的问题。

发明内容

针对上述存在的问题,本发明旨在提供一种基于上下文语义的微博短文本的情感分析方法,其采用情感圈(SentiCircles)方法,捕捉词汇上下文语义(比如文本中词语的语义共现模式)建立词语的动态表示,适时调整已构建的情感本体中情感词的情感极性和强度。

为了实现上述目的,本发明所采用的技术方案如下:

一种基于上下文语义的微博短文本的情感分析方法,其特征在于,包括以下步骤:

步骤1:获取微博短文本数据,基于该文本数据,获取上下文语境信息,并根据所述上下文语境信息构建一组微博文本集T;

步骤2:采用分词方法对每组微博文本集T中的文本进行分词处理,根据分词结果为每个词语创建词语索引,并通过多种文本处理方法对词语进行预处理操作;

步骤3:针对所述的一组微博文本集T,生成词语m的上下文语境向量;

步骤4:通过为每个词语m计算其与语境中其它词语的相关度来得到上下文语境特征,同时使用外部情感本体为所述语境中的语境词ci分配初始情感值,即ci的先验情感值;

步骤5:将词语m的词语语境向量转换为2D几何圆,以此表示情感极性和情感强度值,该几何圆即为构建的情感圈;

步骤6:基于情感圈进行实体级和微博级的情感识别,得到识别结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖州师范学院,未经湖州师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110411497.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top