[发明专利]文本分析方法、装置、计算机设备和存储介质有效
申请号: | 201811021170.2 | 申请日: | 2018-09-03 |
公开(公告)号: | CN109271627B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 徐灿 | 申请(专利权)人: | 深圳市腾讯网络信息技术有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F16/35;G06F18/24 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 何平;邓云鹏 |
地址: | 518101 广东省深圳市宝安区新安街道新安六路御景*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 分析 方法 装置 计算机 设备 存储 介质 | ||
1.一种文本分析方法,所述方法包括:
获取待分析文本;
将所述待分析文本输入到情感分类模型中,得到所述待分析文本对应的目标情感类型;
获取所述待分析文本对应的候选对象集合,所述候选对象集合包括多个候选对象;
将所述待分析文本输入到文本对象判别模型中,得到从所述候选对象集合中筛选出的所述目标情感类型对应的目标对象,所述目标对象是指所述待分析文本中所述目标情感类型所指向的对象,包括:针对不同的位置的候选对象,以所述各个候选对象为中心,将所述待分析文本分为上文语句分以及下文语句,然后分别对上文语句以及下文语句进行编码,将编码得到的结果进行组合,得到文本编码向量,将文本编码向量经过全连接层并利用激活函数进行处理,得到所述各个候选对象为目标情感类型对应的对象的概率,将概率最大的候选对象作为目标对象;
根据所述目标情感类型和对应的目标对象得到所述待分析文本对应的文本分析结果。
2.根据权利要求1所述的方法,其特征在于,所述将所述待分析文本输入到情感分类模型中,得到所述待分析文本对应的目标情感类型包括:
将所述待分析文本进行分词,得到所述待分析文本对应的词序列;
获取所述词序列中的目标词语对应的各个目标词向量,将所述各个目标词向量进行组合,得到目标向量矩阵;
根据特征提取矩阵集合对所述目标向量矩阵进行特征提取,得到各个特征提取矩阵对应的特征向量,其中所述特征提取矩阵集合包括多种不同尺度的特征提取矩阵;
根据所述各个特征提取矩阵对应的特征向量得到所述待分析文本对应的目标情感类型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述各个特征提取矩阵对应的特征向量得到所述待分析文本对应的目标情感类型包括:
对所述各个特征提取矩阵提取得到的特征向量进行下采样处理,得到各个特征向量对应的下采样值;
将所述各个特征向量对应的下采样值进行拼接,得到拼接向量;
将所述拼接向量输入情感分类网络单元,得到所述待分析文本对应的目标情感类型。
4.根据权利要求1所述的方法,其特征在于,所述将所述待分析文本输入到文本对象判别模型中,得到从所述候选对象集合中筛选出的所述目标情感类型对应的目标对象包括:
将所述待分析文本输入到文本对象判别模型中,所述文本对象判别模型根据所述候选对象在所述待分析文本中的位置对所述待分析文本进行编码,得到所述候选对象对应的文本编码结果;
根据所述文本编码结果从所述候选对象集合中筛选得到所述目标情感类型对应的目标对象。
5.根据权利要求4所述的方法,其特征在于,所述将所述待分析文本输入到文本对象判别模型中,所述文本对象判别模型根据所述候选对象在所述待分析文本中的位置对所述待分析文本进行编码,得到所述候选对象对应的文本编码结果包括:
根据所述候选对象在所述待分析文本中的位置获取所述候选对象对应的上文语句以及下文语句;
所述文本对象判别模型根据编码隐层分别对所述候选对象对应的上文语句以及下文语句进行编码,得到所述候选对象对应的上文编码向量以及下文编码向量;
将所述候选对象对应的上文编码向量以及下文编码向量进行拼接,得到所述候选对象对应的文本编码结果。
6.根据权利要求5所述的方法,其特征在于,所述文本对象判别模型根据编码隐层分别对所述上文语句以及下文语句进行编码,得到所述候选对象对应的上文编码向量以及下文编码向量包括:
获取所述上文语句以及下文语句中的候选对象,将对象类型对应的词向量作为所述候选对象对应的词向量,所述词向量用于进行编码。
7.根据权利要求1所述的方法,其特征在于,所述文本对象判别模型的训练步骤包括:
获取情感类型为目标情感类型的训练文本;
获取所述训练文本中目标情感类型对应的目标训练对象以及非目标情感类型对应的参考训练对象;
根据所述训练文本、所述目标训练对象以及所述参考训练对象在所述训练文本中的位置对文本对象判别模型进行训练,得到已训练的文本对象判别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市腾讯网络信息技术有限公司,未经深圳市腾讯网络信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811021170.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:文本语义分析方法
- 下一篇:一种图像描述生成方法