[发明专利]一种支持跨语言迁移的细粒度情感分析方法有效
申请号: | 201911214600.7 | 申请日: | 2019-12-02 |
公开(公告)号: | CN111160037B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 胡勇军 | 申请(专利权)人: | 广州大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 何文聪 |
地址: | 510006 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 支持 语言 迁移 细粒度 情感 分析 方法 | ||
1.一种支持跨语言迁移的细粒度情感分析方法,其特征在于:包括以下步骤:
对电商评论文本进行随机抽样,并对抽样文本进行人工标注,获得该文本的主题情感标注数据集;
把标注数据集放进语义-长短时记忆网络进行训练,得到文本的语义团;
把得到的语义团与抽样文本一同通过基于层面的情感模型进行训练,得到该文本的主题特征;
通过微调网络对标注数据集与主题特征进行训练,得到抽样文本的嵌入向量;
将嵌入向量与主题特征进行特征融合,得到该文本的情感分类结果;
所述把标注数据集放进语义-长短时记忆网络进行训练,得到文本的语义团这一步骤,包括以下步骤:
提取对应层面和情感常用词汇;
删除同时属于两个或两个以上特征类的词;
对于每个特征分类,将每个特征分类中与其他常用词之间语义距离最小的词作为中心语义;
确定所有特征分类的词的中心语义,得到语义团;
还包括基于层面的情感模型的构建步骤;
所述基于层面的情感模型的构建步骤这一步骤,包括以下步骤:
确定词语特征,所述词语特征包括语义词语特征和情感词语特征;
生成每个词语特征的主题单词;
确定文档的情感层面词和主题分布;
确定文档的单词后,生成情感层面的极性分布以及主题模型分布。
2.根据权利要求1所述的一种支持跨语言迁移的细粒度情感分析方法,其特征在于:所述语义距离由经过语义-长短时记忆网络训练的词的嵌入向量之间的余弦距离来度量。
3.根据权利要求1-2任一项所述的一种支持跨语言迁移的细粒度情感分析方法,其特征在于:还包括预训练语义-长短时记忆网络的步骤。
4.根据权利要求3所述的一种支持跨语言迁移的细粒度情感分析方法,其特征在于:所述预训练语义-长短时记忆网络这一步骤,包括以下步骤:
根据每个单词的能量来确定语义-长短时记忆网络中的无监督语义关系;
基于无监督语义相似模型,通过能量函数构建无监督语义层;
构建向后激活函数;
通过长短时记忆网络的交叉熵代价函数和向后激活函数,构建语义-长短时记忆网络的优化目标;
其中,所述单词的能量的表达式为:
E(θ,w,φw,bw)=-θTφw-bw
其中,w表示某一个单词,φw表示这个单词对应的词向量,θ表示词向量的权重,bw是补偿参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911214600.7/1.html,转载请声明来源钻瓜专利网。