[发明专利]一种文本情感分析方法、计算机可读存储介质及终端设备有效

专利信息
申请号: 201810309676.7 申请日: 2018-04-09
公开(公告)号: CN108733644B 公开(公告)日: 2019-07-19
发明(设计)人: 张依;汪伟;肖京 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06F17/27 分类号: G06F17/27;G06F16/35
代理公司: 深圳中一专利商标事务所 44237 代理人: 官建红
地址: 518000 广东省深*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 列向量 文本情感 分词 语句 输入矩阵 文本 预设 计算机可读存储介质 数据库 输入向量 终端设备 分析 词向量 计算机技术领域 神经网络模型 分析对象 情感类型 词语 查找 记录
【权利要求书】:

1.一种文本情感分析方法,其特征在于,包括:

对待分析的语句文本进行切词处理,得到构成所述语句文本的各个分词;

在预设的词向量数据库中分别查找各个所述分词的列向量,并将各个所述分词的列向量组成输入矩阵,其中,所述输入矩阵的每一列均对应一个列向量,所述词向量数据库为记录词语与列向量之间的对应关系的数据库;

从所述语句文本中选取一个与预设的分析对象对应的分词作为文本情感分析的情感主体;

将所述输入矩阵和输入向量输入到预设的文本情感分析神经网络模型中,得到所述情感主体在所述语句文本中的情感类型,所述输入向量为所述情感主体的列向量;

所述文本情感分析神经网络模型的数据处理过程包括:

根据下式计算所述输入矩阵和所述输入向量之间的耦合向量:

CoupVec=(CoupFactor1,CoupFactor2,......,CoupFactorn,......,CoupFactorN)T

其中,1≤n≤N,N为所述输入矩阵的列数,T为转置符号,

WordVecn为所述输入矩阵的第n列,MainVec为所述输入向量,WeightMatrix、WeightMatrix′均为预设的权值矩阵,CoupVec为所述耦合向量;

根据下式计算所述语句文本的复合向量:

CompVec=WordMatrix*CoupVec,

其中,CompVec为所述复合向量,WordMatrix为所述输入矩阵,

且WordMatrix=(WordVec1,WordVec2,......,WordVecn,......,WordVecN);

根据下式分别计算各个情感类型的概率值:

其中,1≤m≤M,M为情感类型的个数,WeightMatrixm为预设的与第m个情感类型对应的权值矩阵,Probm为第m个情感类型的概率值;

将概率值最大的情感类型确定为所述情感主体在所述语句文本中的情感类型。

2.根据权利要求1所述的文本情感分析方法,其特征在于,所述文本情感分析神经网络模型的训练过程包括:

选取预设数目的训练样本,每个样本包括一个输入矩阵、一个输入向量和一个预期输出情感类型;

将各个所述训练样本分别输入到所述文本情感分析神经网络模型中进行处理,并根据下式计算本轮训练的全局误差:

其中,CalcProbl,m为第m个情感类型在第l个训练样本中的概率值,ExpProbl,m为第m个情感类型在第l个训练样本中的预期概率值,

且ExpSeq为第l个训练样本的预期输出情感类型的序号,1≤l≤L,L为所述训练样本的数目,1≤m≤M,M为情感类型的个数,ln为自然对数函数,LOSSl为第l个训练样本的训练误差,LOSS为所述全局误差;

若所述全局误差大于或等于预设的误差阈值,则对所述文本情感分析神经网络模型的参数进行调整,并返回执行所述将各个所述训练样本分别输入到所述文本情感分析神经网络模型中进行处理的步骤,直至所述全局误差小于所述误差阈值为止;

若所述全局误差小于所述误差阈值,则结束训练。

3.根据权利要求2所述的文本情感分析方法,其特征在于,所述选取预设数目的训练样本包括:

以训练样本对的形式成对选取训练样本,每个训练样本对包括两个训练样本,同一训练样本对中的两个训练样本的输入矩阵相同,为同一语句文本的各个分词的列向量所组成的矩阵,同一训练样本对中的两个训练样本的输入向量不同,分别为同一语句文本的两个不同情感主体的列向量,同一训练样本对中的两个训练样本的预期输出情感类型不同,一个为正面情感类型,另一个为负面情感类型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810309676.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top