[发明专利]一种基于多任务深度学习的商品评价分析方法在审
| 申请号: | 201910428969.1 | 申请日: | 2019-05-22 |
| 公开(公告)号: | CN110297902A | 公开(公告)日: | 2019-10-01 |
| 发明(设计)人: | 谢金宝;李瑞彤;康守强;王庆岩;王玉静;梁新涛 | 申请(专利权)人: | 哈尔滨理工大学 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06Q30/02 |
| 代理公司: | 哈尔滨市伟晨专利代理事务所(普通合伙) 23209 | 代理人: | 李晓敏 |
| 地址: | 150080 黑龙*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 损失函数 词向量 学习 分析 预处理 自然语言处理 分析处理 情感极性 神经网络 特征分布 特征约束 文本数据 中文词语 测试集 双通道 停用词 下降法 训练集 中间层 分类 权重 去除 样本 语言 优化 网络 | ||
一种基于多任务深度学习的商品评价分析方法,属于自然语言处理领域。本发明提供了一种能够实现多任务深度学习、稳定性好、准确性高的商品评价分析方法。本发明中,对文本数据集进行预处理,划分为训练集和测试集后去除停用词后,使用word2vec词向量模型将中文词语表征为词向量;输入到双通道LSTM网络中共享权重,利用样本对pair‑wise损失函数在神经网络的中间层进行特征约束,经过梯度下降法进行学习;利用softmax分类损失函数实现情感极性分析,pari‑wise损失函数学习特征分布,将softmax分类损失函数和pair‑wise损失函数结合对进行优化。本发明主要用于分析处理商品评价语言。
技术领域
本发明属于人工智能下的自然语言处理领域,具体涉及一种基于多任务深度学习的商品评价分析方法。
背景技术
商品评价分析主要是基于评论的情感分析,并且现有的指标是综合打分系统来分析商品。现有的商品评价分析领域主要的分析研究方法基本上还是基于规则的方法、传统的机器学习方法和深度学习方法,例如支持向量机、信息熵、条件随机场等。商品评价中的情感分析首先起源于基于语法规则的文本分析,方法比较简单,需要具有语法敏感性的研究人员建立情感分析的词典,然后将表达情感的词汇分为两个类别,对比情感词的个数来评估情感的倾向。其次是基于传统的机器学习方法,其通过机器学习算法进行情感分类,但对于本身的文本特征提取的依赖性特别严重,整个特征提取的过程受人为干扰的因素较严重。最后是现在都普遍流行使用的深度神经网络学习方法,主要使用卷积神经网络,循环神经网络和长短记忆神经网络等,深度神经网络在多个领域发挥了重大的作用,将神经网络应用于商品评价领域,可以解决传统机器学习应用中所产生的特征提取主观性难题,提升产品评价情感判断的准确性。
传统的商品评价分析都是基于单任务的学习模式进行学习,对于复杂的学习任务也可以拆分成多个单任务来进行学习,然后对学习到的最后结果进行组合。而且传统的单任务学习会针对每一个任务的数据集进行训练得到最终的模型。然而,现实生活中很多任务都是有一定相关联系的,多任务的学习的主要目的就是寻找任务之间的关系,如果任务之间存在一定的关系,那么不同任务之间就可以一起学习,互相提供有用的额外信息,利用这些额外信息,就能得到鲁棒性更好地模型,也可以提高模型的泛化能力。当单个任务的数据集不够充分时,此时如果采用多任务学习就可以有很好的效果,因为多任务学习可以能够从多个任务中得到额外信息,在数据集不充足的情况下进行多个相关任务,能够使其他任务的数据集增加主任务的数据集,因此实现多任务学习的学习往往比单任务学习的效果要好,也提高了模型的稳定性。
因此,就需要一种能够实现多任务深度学习、稳定性好、准确性高的商品评价分析方法。
发明内容
本发明针对现有的商品评价分析方法不能实现多任务深度学习、稳定性差、准确性差的缺陷,提供了一种能够实现多任务深度学习、稳定性好、准确性高的商品评价分析方法。
本发明所涉及的一种基于多任务深度学习的商品评价分析方法的技术方案如下:
本发明所涉及的一种基于多任务深度学习的商品评价分析方法,它包括以下步骤:
步骤一:在网页中获取原始文本数据集,对文本数据集进行预处理,将文本数据集划分为训练集和测试集;
步骤二:将训练集和测试集去除停用词后,使用word2vec词向量模型将中文词语表征为词向量,构成词向量序列;
步骤三:将词向量序列的输出特征作为模型输入到双通道LSTM网络中共享权重,利用样本对pair-wise损失函数在神经网络的中间层进行特征约束,然后经过梯度下降法进行学习;
步骤四:利用网络顶端的softmax分类损失函数实现情感极性分析,pari-wise损失函数利用局部分布特征学习特征分布,将softmax分类损失函数和pair-wise损失函数结合对进行优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910428969.1/2.html,转载请声明来源钻瓜专利网。





