[发明专利]基于强化学习和胶囊网络的文本分类模型及方法有效
申请号: | 201811109798.8 | 申请日: | 2018-09-21 |
公开(公告)号: | CN109241287B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 林东定;潘嵘 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 陈伟斌 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 强化 学习 胶囊 网络 文本 分类 模型 方法 | ||
1.基于强化学习和胶囊网络的文本分类模型,其特征在于,包括强化学习的框架与胶囊网络的框架;采用强化学习来学习胶囊网络层之间的路由关系,采用胶囊网络融合语序和结构的信息,在胶囊网络中通过神经网络对融合的信息进行解析,得到多标签的分类结果;
强化学习的框架包括:
State:表示当前的状态,该状态包含Agent所处的环境和自身状态;
Action:表示Agent的行动,该行动表示胶囊层之间的是否连接,或者连接概率;
Reward:表示Agent获得的奖励,分为即时奖励和未来的奖励;
胶囊网络的框架包括以下步骤:
S1.将原始的raw text经过分词或者分字,再经过一个查询表转换成embedding形式的字或者词;
S2.将embedding形式的字或者词根据TextCNN的方法得到卷积后的Primary Capsule;
S3.将Primary Capsule经过Routing后与下一层Capsule Layer连接,随后与FullConnect Network连接,输出不同的标签的概率大小;
S4.经过BP算法修改Full Connect Layer的权重大小,以及Embedding层中查询表的各个词的表示向量。
2.根据权利要求1所述的基于强化学习和胶囊网络的文本分类模型的方法,其特征在于:所述的步骤S1中,具体过程是:
S11.先根据已有的word embedding来初始化查询表,其中embedding的矩阵深度为300,对于没有出现过的单词的embedding向量则置为0或者0-1之间的随机数;
S12.然后通过搜寻的方式,对于raw text中的每一个词或者每一个字转换成embedding的格式,相应的,raw text每一句就转换成了long*300形式的矩阵。
3.根据权利要求2所述的基于强化学习和胶囊网络的文本分类模型的方法,其特征在于:所述的步骤S2中,具体过程是:
S21.对于long*300的矩阵,用kernel size分别为3*300,4*300,5*300的卷积核卷积得到对应的特征向量,每一种kernel size的数量为32个;
S22.用kernel size分别为3*300,4*300,5*300的卷积核卷积得到对应的特征向量,每一种kernel size的数量为32个,生成的Vector_Size*32,经过一个32*32*16的转换矩阵,得到VS*32*16的Primary Capsule,其中Capsule的维度是16。
4.根据权利要求3所述的基于强化学习和胶囊网络的文本分类模型的方法,其特征在于:所述的步骤S3中,具体过程是:
S31.根据S22得到的VS*32*16的Primary Capsule,将Capsule Layer设定32*16*16的Capsule Layer,包括16个filters;
S32.将VS*32*32*16的权重矩阵值设为强化学习中的State,每一次action修改State中的权重值;
S33.根据权重矩阵计算得到32*16*16的Capsule Layer,将其展开通过一个FullConnect的神经网络,再通过一个Softmax层,得到不同的标签的概率大小;
S34.根据得到不同的标签的概率大小与正确结果相比,得到的loss value作为强化学习中的Reward,利用A3C算法改进S32中的权重矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811109798.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于生成文本的方法和装置
- 下一篇:文本分类模型的更新训练方法、装置及设备