[发明专利]一种基于新型注意模型进行图像字幕生成的方法在审

申请号：	201710632600.3	申请日：	2017-07-28
公开（公告）号：	CN107391709A	公开（公告）日：	2017-11-24
发明（设计）人：	夏春秋	申请（专利权）人：	深圳市唯特视科技有限公司
主分类号：	G06F17/30	分类号：	G06F17/30;G06K9/46;G06N3/08
代理公司：	暂无信息	代理人：	暂无信息
地址：	518057 广东省深圳市高新技术产业园***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提出一种基于新型注意模型进行图像字幕生成的方法，其主要内容包括显著度预测模型、选中图像显著区域、显著度和文本感知注意力、字幕生成、分析注意力状态。其过程为，通过新型字幕结构，在字幕生成过程中聚焦所输入图像的不同部位，具体的图像中哪些部位是显著的，哪些部位是需要结合上下文的，由显著度预测模型给定，由卷积神经网络提取图像，递归神经网络生成对应字幕，通过注意模型的扩展，在显著性预测模型中，创造两条注意力途径，一条重点关注显著区域，另一条重点关注上下文区域，两条路径在生成字幕过程中共同合作，逐步生成优秀的字幕，为图像字幕生成的创新解决方案做了进一步贡献。
搜索关键词：	一种基于新型注意模型进行图像字幕生成方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于新型注意模型进行图像字幕生成的方法，其特征在于，主要包括显著度预测模型(一)；选中图像显著区域(二)；显著度和文本感知注意力(三)；字幕生成(四)；分析注意力状态(五)。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司，未经深圳市唯特视科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710632600.3/，转载请声明来源钻瓜专利网。

专利分类

免登录下载普通用户下载升级VIP会员，免费下载

专利文献下载