[发明专利]一种基于联合学习的文本情报分类方法、装置及计算机设备在审
| 申请号: | 201810552043.9 | 申请日: | 2018-05-31 |
| 公开(公告)号: | CN108763542A | 公开(公告)日: | 2018-11-06 |
| 发明(设计)人: | 张镇;伊文超;史云飞;梁波;赵国强 | 申请(专利权)人: | 中国华戎科技集团有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 吴东勤 |
| 地址: | 100000 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 情报 文本 循环神经网络 分类 计算机设备 分类网络 混合神经网络 卷积神经网络 实体间关系 记忆网络 时间成本 自动识别 数据量 协同 联合 梳理 输出 学习 | ||
1.一种基于联合学习的文本情报分类方法,其特征在于,包括:
S1:将第一文本情报输入双向长短期记忆循环神经网络Bi-LSTM进行处理;所述第一文本情报为训练分类网络所用的文本情报;
S2:将经过所述双向长短期记忆循环神经网络Bi-LSTM处理后的输出,分别作为长短期记忆网络LSTM和协同卷积神经网络CNN的输入,共同进行混合神经网络训练,得到文本情报的分类网络;
S3:将第二文本情报输入双向长短期记忆循环神经网络Bi-LSTM进行处理,将处理的结果输入到所述分类网络,得到所述第二文本情报的情报实体间关系的分类;所述第二文本情报为待分类的文本情报。
2.根据权利要求1所述的方法,其特征在于,在所述S1和S3中,所述处理过程包括:通过双向长短期记忆循环神经网络Bi-LSTM对输入的第一/第二文本情报进行编码,得到情报融合向量。
3.根据权利要求2所述的方法,其特征在于,在所述S2中,所述作为LSTM的输入和协同卷积神经网络CNN的输入,共同进行混合神经网络训练的过程包括:
对编码后得到的所述融合向量通过长短期记忆循环神经网络LSTM进行情报实体识别,得到情报实体识别模型;
对编码后得到的所述融合向量通过协同卷积神经网络CNN进行情报实体识别,得到情报实体关系类别模型;
将所述情报实体识别模型、和所述情报实体关系类别模型作为所述分类网络。
4.根据权利要求3所述的方法,其特征在于,在所述S3中,所述得到所述第二文本情报的情报实体间关系的分类的过程包括:
将处理所述第二文本情报的情报融合向量,输入到情报实体识别模型,得到情报实体标签;
将处理所述第二文本情报的情报融合向量,输入到情报实体关系类别模型,得到情报实体关系类别。
5.根据权利要求1或4所述的方法,其特征在于,所述S2中使用的所述卷积神经网络CNN为5层卷积层,5层池化层,卷积核大小为5×5,每层卷积层的卷积核为6个,激活函数为线性整流函数ReLU函数。
6.一种基于联合学习的文本情报提取装置,其特征在于,包括:
输入模块:用于将第一文本情报输入双向长短期记忆循环神经网络Bi-LSTM;所述第一文本情报为训练分类网络所用的文本情报;
训练模块:用于将经过所述双向长短期记忆循环神经网络Bi-LSTM处理后的输出,分别作为长短期记忆网络LSTM和协同卷积神经网络CNN的输入,共同进行混合神经网络训练,得到文本情报的分类网络;
分类模块:用于将第二文本情报输入双向长短期记忆循环神经网络Bi-LSTM进行处理,将处理的结果输入到所述分类网络,得到所述第二文本情报的情报实体间关系的分类;所述第二文本情报为待分类的文本情报。
7.根据权利要求6所述的装置,其特征在于,所述输入模块的所述处理过程包括:通过双向长短期记忆循环神经网络Bi-LSTM对输入的第一/第二文本情报进行编码,得到情报融合向量。
8.根据权利要求7所述的装置,其特征在于,所述训练模块的所述作为LSTM的输入和协同卷积神经网络CNN的输入,共同进行混合神经网络训练的过程包括:对编码后得到的所述融合向量通过长短期记忆循环神经网络LSTM进行情报实体识别,得到情报实体识别模型;
对编码后得到的所述融合向量通过协同卷积神经网络CNN进行情报实体识别,得到情报实体关系类别模型;
将所述情报实体识别模型、和所述情报实体关系类别模型作为所述分类网络。
9.根据权利要求8所述的装置,其特征在于,所述分类模块的所述得到所述第二文本情报的情报实体间关系的分类的过程包括:
将处理所述第二文本情报的情报融合向量,输入到情报实体识别模型,得到情报实体标签;
将处理所述第二文本情报的情报融合向量,输入到情报实体关系类别模型,得到情报实体关系类别。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-5任一项中所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国华戎科技集团有限公司,未经中国华戎科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810552043.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种页面显示方法及终端
- 下一篇:数据库审计监测系统





