[发明专利]一种基于深度学习的图像语义生成方法在审
| 申请号: | 201611035273.5 | 申请日: | 2016-11-17 | 
| 公开(公告)号: | CN108073941A | 公开(公告)日: | 2018-05-25 | 
| 发明(设计)人: | 张威;周治平 | 申请(专利权)人: | 江南大学 | 
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 | 
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 | 
| 地址: | 214122 江苏省无锡市滨湖*** | 国省代码: | 江苏;32 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | 本发明公开了一种基于深度学习的图像语义生成方法,该方法包括以下步骤:第一,通过图像整体语义生成要求,构建结合卷积神经网络和长段时间记忆网络的模型结构;第二,将人工标注好的图像输入到预训练好的卷积神经网络;第三,将人工标注的图像语义描述与卷积神经网络提取到的图像特征输入到长段时间记忆网络中;第四,根据生成的图像语义描述与人工标注信息进行计算其损失函数;第五,根据损失函数,反向传播优化卷积神经网络和长段时间记忆网络各个参数。本发明应用卷积神经网络技术和长短时间记忆网络生成图像语义描述。 | ||
| 搜索关键词: | 图像语义 卷积神经网络 时间记忆 人工标注 长段 损失函数 神经网络技术 网络 语义 反向传播 模型结构 图像输入 图像特征 图像整体 网络生成 应用卷积 构建 学习 优化 | ||
【主权项】:
                1.一种基于深度学习的图像语义生成方法;其特征在于,所述的方法基于深度学习的图像语义生成主要包含如下步骤:步骤1:通过图像整体语义生成要求,构建一种结合卷积神经网络和长段时间记忆网络的模型结构;步骤2:为解决“过拟合”问题,使用其他数据预训练卷积神经网络,得到预训练好的卷积神经网络,通过训练数据对所述预训练好卷积神经网络进行训练得到卷积神经网络模型;步骤3:通过卷积神经网络提取的图像高层特征和正确的语义信息对长短时间记忆网络进行训练得到长短时间记忆网络模型,然后通过训练数据对卷积神经网络和长短时间记忆网络进行联合训练得到最终的图像语义产生模型;步骤4:将图像输入到得到的模型中,生成图像内容的语义描述。
            
                    下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
                
                
            该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611035273.5/,转载请声明来源钻瓜专利网。





