[发明专利]文本分类方法和装置有效
申请号: | 201710156443.3 | 申请日: | 2017-03-16 |
公开(公告)号: | CN108628868B | 公开(公告)日: | 2021-08-10 |
发明(设计)人: | 王青泽;王永亮;陈标龙;翁志 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 曹蓓 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 分类 方法 装置 | ||
1.一种文本分类方法,包括:
将待分类文本输入词向量计算模块,获取词向量;
将所述词向量输入神经网络,获取输出编码;
通过分类模块处理所述输出编码,获取文本分类结果,
其中,所述词向量计算模块和所述神经网络通过一体化训练生成,训练过程包括:将训练文本输入待训练的所述词向量计算模块;待训练的所述词向量计算模块将生成的词向量输入待训练的所述神经网络;通过后验算法调整待训练的所述神经网络的参数,生成所述词向量计算模块和所述神经网络。
2.根据权利要求1所述的方法,其中,所述后验算法包括反向传播算法。
3.根据权利要求1所述的方法,其中:
所述神经网络包括长短期记忆LSTM模块;
所述通过分类模块处理所述输出编码,获取文本分类结果包括:通过分类模块处理所述LSTM模块最后一个单元的所述输出编码,获取文本分类结果。
4.根据权利要求1所述的方法,其中:
所述神经网络包括长短期记忆LSTM模块;
所述文本分类方法还包括:获取所述LSTM模块各个单元的所述输出编码,确定输出编码平均值;
所述通过分类模块处理所述输出编码,获取文本分类结果包括:所述分类模块处理所述输出编码平均值,获取文本分类结果。
5.根据权利要求1~4任意一项所述的方法,其中:
所述分类模块包括Softmax回归计算模块;
所述待分类文本包括:用户评价文本和/或商品介绍文本;
和/或,
所述文本分类结果包括:用户满意程度分类、服务质量分类、产品质量分类和/或产品敏感词分类。
6.一种文本分类方法,包括:
将训练文本输入待训练的词向量计算模块;
待训练的所述词向量计算模块将生成的词向量输入待训练的神经网络;
通过后验算法调整待训练的所述神经网络的参数,生成词向量计算模块和神经网络,以便对输入所述词向量计算模块的待分类文本通过所述神经网络进行分类。
7.根据权利要求6所述的方法,还包括:
将待分类文本输入所述词向量计算模块,获取词向量;
将所述词向量输入所述神经网络,获取输出编码;
通过分类模块处理所述输出编码,获取文本分类结果。
8.根据权利要求7所述的方法,其中:
所述神经网络包括长短期记忆LSTM模块;
所述分类模块包括Softmax回归计算模块;和/或,
所述后验算法包括反向传播算法。
9.一种文本分类装置,包括:
词向量计算模块,用于接收待分类文本,生成词向量;
神经网络,用于获取来自所述词向量计算模块的词向量,生成输出编码,其中,所述词向量计算模块和所述神经网络通过一体化训练生成,训练过程包括:将训练文本输入待训练的所述词向量计算模块;待训练的所述词向量计算模块将生成的词向量输入待训练的所述神经网络;通过后验算法调整待训练的所述神经网络的参数,生成所述词向量计算模块和所述神经网络;
分类模块,用于处理所述输出编码,获取文本分类结果。
10.根据权利要求9所述的装置,还包括:
训练模块,用于通过一体化训练生成所述词向量计算模块和所述神经网络,具体包括:
训练文本输入单元,用于将训练文本输入待训练的所述词向量计算模块,待训练的所述词向量计算模块将生成的词向量输入待训练的所述神经网络;
参数调整单元,用于通过后验算法调整待训练的所述神经网络的参数,生成所述神经网络。
11.根据权利要求10所述的装置,所述后验算法包括反向传播算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710156443.3/1.html,转载请声明来源钻瓜专利网。