[发明专利]一种支持跨语言迁移的细粒度情感分析方法有效

专利信息
申请号: 201911214600.7 申请日: 2019-12-02
公开(公告)号: CN111160037B 公开(公告)日: 2021-10-26
发明(设计)人: 胡勇军 申请(专利权)人: 广州大学
主分类号: G06F40/30 分类号: G06F40/30;G06K9/62;G06N3/04;G06N3/08
代理公司: 广州嘉权专利商标事务所有限公司 44205 代理人: 何文聪
地址: 510006 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 支持 语言 迁移 细粒度 情感 分析 方法
【说明书】:

发明公开了一种支持跨语言迁移的细粒度情感分析方法,方法包括以下步骤:对电商评论文本进行随机抽样,并对抽样文本进行人工标注,获得该文本的主题情感标注数据集;把标注数据集放进语义‑长短时记忆网络进行训练,得到文本的语义团;把得到的语义团与抽样文本一同通过基于层面的情感模型进行训练,得到该文本的主题特征;通过微调网络对标注数据集与主题特征进行训练,得到抽样文本的嵌入向量;将嵌入向量与主题特征进行特征融合,得到该文本的情感分类结果。本发明考虑到产品评论中极性分布不对称、层面稀疏和情感词分布不均匀的情况,提高了情感分析的准确度,可广泛应用于文本数据挖掘领域。

技术领域

本发明涉及文本数据挖掘领域,尤其是一种支持跨语言迁移的细粒度情感分析方法。

背景技术

情感分析能够从大量的非结构化评论文本中自动挖掘和提取人们的观点、态度和情感。传统的情感分析主要是对整个文档或句子进行粗粒度的极性分析。然而,仅考虑极性是不可能充分表征评论文本的多个层面的细粒度态度。基于对产品不同维度的考量,提出了多层面(不同细粒度)情感分析方法,通过对产品各层面的显式和隐式特征的分析,发现各层面与情感词之间的关系。

现有的情感分析方法大致可分为监督学习方法和非监督学习方法。早期基于监督学习的多层面情感分析(MASA)主要应用朴素贝叶斯、最大熵分类和支持向量机等传统工具。深度学习在很多领域都取得了显著的成果,在MASA中也得到了应用,这些方法通常需要预定义的情感词典,并且依赖于对词的位置表示。这些要求不可避免地导致大量的手工标记工作。此外,他们可能无法处理具有挑战性的电子商务场景与大量的评论和不规则的文字。

在无监督学习中,概率潜在语义分析(PLSA)、隐含狄利克雷分布(LDA)等统计主题模型引入先验知识,在情感分析中取得了良好的效果。然而,这些现有的模型不能直接应用于MASA。因为其掌握的主题不能直接与情感或层面联系起来。因此,研究人员开发了层面与情感统一模型(ASUM),将层面与情感集成到一个主题模型中,使无监督学习更加灵活。虽然ASUM通常会显示一些全球性的特征,比如知名品牌,但它不太可能从不知名产品的评论中发现本土的特征。为了解决这一问题,通过引入了本地因素和全局因素,建立了联合多粒话题情绪(JMTS)模型。JMTS模型相对于LDA和ASUM的关键优势在于改进了情绪分类的性能。然而,在JMTS中,情感词的稀疏性和语义分布的不对称性等问题一直没有得到很好的解决。这是因为JMTS模型还依赖于预先设置的超参数。

现有的监督和非监督学习情感分析工作主要集中在英语语料库方面。值得注意的是,其他一些语言,如汉语,有自己的语言结构,如字母表,音系,词汇和语法。汉语语料库中常用省略和缩略语。与此同时,电子商务领域不断出现新的中文词汇。在这种背景下,英语的情感分析方法可能不再适用于汉语的情感分析。这就需要一种全新的多语言情感分析方法,以应对跨领域和跨语言MASA的迁移学习的挑战。

发明内容

有鉴于此,本发明实施例提供一种分析结果准确的,支持跨语言迁移的细粒度情感分析方法。

第一方面,本发明实施例提供了一种支持跨语言迁移的细粒度情感分析方法,包括以下步骤:

对电商评论文本进行随机抽样,并对抽样文本进行人工标注,获得该文本的主题情感标注数据集;

把标注数据集放进语义-长短时记忆网络进行训练,得到文本的语义团;

把得到的语义团与抽样文本一同通过基于层面的情感模型进行训练,得到该文本的主题特征;

通过微调网络对标注数据集与主题特征进行训练,得到抽样文本的嵌入向量;

将嵌入向量与主题特征进行特征融合,得到该文本的情感分类结果。

进一步,所述把标注数据集放进语义-长短时记忆网络进行训练,得到文本的语义团这一步骤,包括以下步骤:

提取对应层面和情感常用词汇;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911214600.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top