[发明专利]一种面向小样本的影像语义对齐系统有效

申请号：	201910327483.9	申请日：	2019-04-23
公开（公告）号：	CN110084297B	公开（公告）日：	2023-09-15
发明（设计）人：	李继云;王伟鹏;李凯华;孙莉;乐嘉锦	申请（专利权）人：	东华大学
主分类号：	G06V10/764	分类号：	G06V10/764;G06V10/774;G06V10/82;G06N3/0464;G06N3/0442;G06N3/08;G16H50/50;G16H50/20
代理公司：	上海申汇专利代理有限公司 31001	代理人：	翁若莹;柏子雵
地址：	201600 上***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种面向样本影像语义对齐系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种面向小样本的影像语义对齐系统，其特征在于，包括数据预处理层、编码层和解码层，其中：

数据预处理层为数据前期准备阶段，对输入的影像图像和文本进行预处理操作，并对图像进行裁剪、旋转、平移来增强数据集；

编码层采用CNN作为编码器将影像图像编码成固定长度的向量，在CNN中提取图像特征，所述编码层由残差网络和全卷积网络构成，在编码层中：

利用U-Net简单地将编码器的特征图拼接至每个阶段解码器的上采样特征而形成一个梯形结构；随后采用残差网络结构，在神经网的前向传播过程中，通过前向神经网络输出+shortcut连接实现，其中，shortcut连接相当于简单执行了恒等映射，不会产生额外的参数，也不会增加计算复杂度；最后使用一个1×256的全连接层来压缩数据维度，并进一步提高语义特征的精度，以用于后续序列预测；

解码层采用LSTM特殊形式的循环网络构建语言模型，所述解码层每个输出时间步骤都会在序列中生成一个新词，然后每个生成的词都会使用一个词嵌入进行编码，该编码会作为输入被传递给解码器以生成后续的词；初始时刻输入image-embedding的特征向量，输入序列经word-embedding后形成相应维词向量，目标序列为输入序列右移一个位置，最终被训练成一个以图像编码为条件的语言模型。

2.如权利要求1所述的一种面向小样本的影像语义对齐系统，其特征在于，所述数据预处理层对图像进行的预处理操作包括医学影像增强的方法，并对包含大面积背景的影像进行阈值分割减少背景区域。

3.如权利要求1所述的一种面向小样本的影像语义对齐系统，其特征在于，所述数据预处理层对文本进行的预处理操作包括分词和报告主要含义语句的提取。

4.一种如权利要求1所述小样本影像语义对齐系统的应用，其特征在于，用于在小样本影像上的训练以及预测。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东华大学，未经东华大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910327483.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于特定语义的图表示学习框架及其多标签分类方法
下一篇：用于检测图像相似度的方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种面向小样本的影像语义对齐系统有效

专利文献下载