[发明专利]情绪向量的生成方法及装置在审
| 申请号: | 201910894144.9 | 申请日: | 2019-09-20 |
| 公开(公告)号: | CN110807323A | 公开(公告)日: | 2020-02-18 |
| 发明(设计)人: | 回艳菲;于凤英;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 黄耀威;贾依娇 |
| 地址: | 518000 广东省深圳市福田街*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 情绪 向量 生成 方法 装置 | ||
1.一种情绪向量的生成方法,其特征在于,包括:
将预设单词样本集合按照语义划分为多组数据集,其中,所述多组数据集包括:心态数据集、感情数据集、精神数据集、脏话数据集、侮辱数据集、心理数据集;
根据所述多组数据集训练决策树模型,获得向量生成模型;
向所述向量生成模型中输入目标情绪词,得到所述目标情绪词的情绪向量。
2.根据权利要求1所述的方法,其特征在于,将预设单词样本划分为多组数据集包括:
采用Word2vec模型将所述预设单词样本集合转换为多个词向量;
将所述多个词向量按照语义划分为多组数据集。
3.根据权利要求2所述的方法,其特征在于,将所述多个词向量按照语义划分为多组数据集包括:
将所述多个词向量按照语义划分为所述心态数据集,其中,所述心态数据集包括:消极的情绪词,积极的情绪词;
将所述多个词向量按照语义划分为所述感情数据集,其中,所述感情数据集包括:褒义的情绪词,贬义的情绪词;
将所述多个词向量按照语义划分为所述精神数据集,其中,所述精神数据集包括:与压力相关的情绪词,与压力无关的情绪词;
将所述多个词向量按照语义划分为所述脏话数据集,其中,所述脏话数据集包括:包含脏话的情绪词,不包含脏话的情绪词;
将所述多个词向量按照语义划分为所述侮辱数据集,其中,所述侮辱数据集包括:包含侮辱语义的情绪词,不包含侮辱语义的情绪词;
将所述多个词向量按照语义划分为所述心理数据集,其中,所述心理数据集至少包括:表现用户焦虑的情绪词,表现用户渴望的情绪词,表现用户纠结的情绪词,表现用户徘徊的情绪词。
4.根据权利要求1所述的方法,其特征在于,根据所述多组数据集训练决策树模型,获得向量生成模型包括:
提取与所述多组数据集分别对应的多组特征向量;
针对所述多组特征向量中的每一组特征向量,训练一个决策树模型,得到多组模型参数;
使用所述多组模型参数构建分类器,获得所述向量生成模型。
5.根据权利要求4所述的方法,其特征在于,提取与所述多组数据集分别对应的多组特征向量包括:
针对所述多组数据集中的每一组数据集,输入词嵌入层,得到多组词向量;
将所述多组词向量中的每一组词向量表示成V*K矩阵,得到与每一组词向量对应的一组特征向量,其中,V表示每一组词向量的数量,K表示每一组词向量中单个词向量的维度。
6.根据权利要求5所述的方法,其特征在于,针对所述多组特征向量中的每一组特征向量,训练一个决策树模型,得到多组模型参数包括:
将所述V*K矩阵输入到一个决策树模型中,得到N*K矩阵,其中,所述决策树模型中含有K棵决策树,N是大于V的正整数;
将所述N*K矩阵作为所述V*K矩阵的一组模型参数。
7.根据权利要求4所述的方法,其特征在于,使用所述多组模型参数构建分类器,获得所述向量生成模型包括:
针对所述多组模型参数中的每一组模型参数,构建一个分类器,基于负对数似然函数计算每一组模型参数的第一损失值;
基于L2损失函数计算所述第一损失值的第二损失值;
将在所述第二损失值达到最小时对应的模型作为所述向量生成模型。
8.一种情绪向量的生成装置,其特征在于,包括:
划分模块,用于将预设单词样本集合按照语义划分为多组数据集,其中,所述多组数据集包括:心态数据集、感情数据集、精神数据集、脏话数据集、侮辱数据集、心理数据集;
训练模块,用于根据所述多组数据集训练决策树模型,获得向量生成模型;
生成模块,用于向所述向量生成模型中输入目标情绪词,得到所述目标情绪词的情绪向量。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910894144.9/1.html,转载请声明来源钻瓜专利网。





