[发明专利]一种深度多层网络驱动的特征聚合类别划分器在审
申请号: | 202010066674.7 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111259152A | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 刘秀萍;李蕊男 | 申请(专利权)人: | 刘秀萍 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/295;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 321200 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 多层 网络 驱动 特征 聚合 类别 划分 | ||
1.一种深度多层网络驱动的特征聚合类别划分器,其特征在于:包括类别划分器建模、训练和分类,特征选择包括文稿特征和图片特征,根据模态聚合模型完成特征聚合类别划分,类别划分器采用五层神经网络模型完成多模态数据类别划分,其中A0为输入,分别接收事先训练的图片和文稿的高层语义特征,A1对输入的多模态特征完成拼接,A2至A3学习一个图片和文稿聚合的多模态混合表示,是一个全连接的多层神经网络,A4完成类别划分预测,产生类别划分结果,多层网络训练是一个有监督的过程,利用类别标记,训练得到的联合表示利于类别划分,在多层神经网络中,A0的节点数与模态特征的长度一致,A1中的节点数是A0中各模态输入节点数的总和,A2的节点数与问题相关,A3的结点数与类标记的个数一致。
2.根据权利要求1所述的一种深度多层网络驱动的特征聚合类别划分器,其特征在于,类别划分器训练和分类过程为:
假设多模态信息的向量表示分别为b1,b2,…,bM,则在A1,拼接后的向量为:
y(1)=[b1;b2;...;bM]
在聚合层,多模态的表示将被聚合,形成多模态联合语义特征,过程为:
y(i)=C(W(i)y(i-1)+e(i)),i=2,3
其中c是非线性函数sigmoid,W(i)和e(i)分别是第i层网络的权重和偏置,在获得多模态联合语义特征后,A4完成类别划分预测,产生类别划分概率:
k、j分别为类别区分下标,n为类别总数,在训练过程中,通过引入softmax的损失函数,通过梯度下降算法进行参数优化,根据类别划分概率,将实体和信息划分到不同的类别中。
3.根据权利要求1所述的一种深度多层网络驱动的特征聚合类别划分器,其特征在于,文稿特征提取过程中,词组向量空间模型使用词为单位的向量表示文稿,通过空间内的向量的相似性表达语义相似性,向量空间模型中,一个文稿向量的每一维表示一个词,用向量间的夹角表示文稿间的相关程度,文稿表示方法通过词的权重向量构成的文稿表示;
假设文档集合G中,给定单词wi和文档dj,词条频度tfI,j表示词wi在dj中的出现次数,文档频度dfi表示G中出现了单词wi的文档篇数,收集频度cfi表示G中出现单词wi的总次数,词条频度表达词条在一篇文档中的重要程度,这一重要程度与词条频度值呈正相关,文档频度反映词的信息量,tf-idf为词与文档之间关系的度量方法,表示如下:
使用tf-idf反映词与文档的关系,本发明的词组向量空间模型建立在以tf-idf为权重的词-文档的矩阵上。
4.根据权利要求1所述的一种深度多层网络驱动的特征聚合类别划分器,其特征在于,本发明采用循环神经网络与卷积神经网络相结合的区域卷积神经网络,解决卷积神经网络中词窗口大小难以确定的问题,通过正向和逆向的循环神经网络,解决由于输入文稿的顺序性产生的有偏问题,循环神经网络与卷积神经网络相结合的类别划分器保留词序信息,在文稿特征上,以摘要内容作为一篇描述定义性的文档使用,通过循环卷积神经网络学习向量表示,本发明选取摘要作为文稿语义特征来源,作为多模态聚合模型文稿模态的输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘秀萍,未经刘秀萍许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010066674.7/1.html,转载请声明来源钻瓜专利网。