[发明专利]一种支持跨语言迁移的细粒度情感分析方法有效

专利信息
申请号: 201911214600.7 申请日: 2019-12-02
公开(公告)号: CN111160037B 公开(公告)日: 2021-10-26
发明(设计)人: 胡勇军 申请(专利权)人: 广州大学
主分类号: G06F40/30 分类号: G06F40/30;G06K9/62;G06N3/04;G06N3/08
代理公司: 广州嘉权专利商标事务所有限公司 44205 代理人: 何文聪
地址: 510006 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 支持 语言 迁移 细粒度 情感 分析 方法
【权利要求书】:

1.一种支持跨语言迁移的细粒度情感分析方法,其特征在于:包括以下步骤:

对电商评论文本进行随机抽样,并对抽样文本进行人工标注,获得该文本的主题情感标注数据集;

把标注数据集放进语义-长短时记忆网络进行训练,得到文本的语义团;

把得到的语义团与抽样文本一同通过基于层面的情感模型进行训练,得到该文本的主题特征;

通过微调网络对标注数据集与主题特征进行训练,得到抽样文本的嵌入向量;

将嵌入向量与主题特征进行特征融合,得到该文本的情感分类结果;

所述把标注数据集放进语义-长短时记忆网络进行训练,得到文本的语义团这一步骤,包括以下步骤:

提取对应层面和情感常用词汇;

删除同时属于两个或两个以上特征类的词;

对于每个特征分类,将每个特征分类中与其他常用词之间语义距离最小的词作为中心语义;

确定所有特征分类的词的中心语义,得到语义团;

还包括基于层面的情感模型的构建步骤;

所述基于层面的情感模型的构建步骤这一步骤,包括以下步骤:

确定词语特征,所述词语特征包括语义词语特征和情感词语特征;

生成每个词语特征的主题单词;

确定文档的情感层面词和主题分布;

确定文档的单词后,生成情感层面的极性分布以及主题模型分布。

2.根据权利要求1所述的一种支持跨语言迁移的细粒度情感分析方法,其特征在于:所述语义距离由经过语义-长短时记忆网络训练的词的嵌入向量之间的余弦距离来度量。

3.根据权利要求1-2任一项所述的一种支持跨语言迁移的细粒度情感分析方法,其特征在于:还包括预训练语义-长短时记忆网络的步骤。

4.根据权利要求3所述的一种支持跨语言迁移的细粒度情感分析方法,其特征在于:所述预训练语义-长短时记忆网络这一步骤,包括以下步骤:

根据每个单词的能量来确定语义-长短时记忆网络中的无监督语义关系;

基于无监督语义相似模型,通过能量函数构建无监督语义层;

构建向后激活函数;

通过长短时记忆网络的交叉熵代价函数和向后激活函数,构建语义-长短时记忆网络的优化目标;

其中,所述单词的能量的表达式为:

E(θ,w,φw,bw)=-θTφw-bw

其中,w表示某一个单词,φw表示这个单词对应的词向量,θ表示词向量的权重,bw是补偿参数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911214600.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top