[发明专利]一种基于新型注意模型进行图像字幕生成的方法在审
申请号: | 201710632600.3 | 申请日: | 2017-07-28 |
公开(公告)号: | CN107391709A | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 夏春秋 | 申请(专利权)人: | 深圳市唯特视科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/46;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市高新技术产业园*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于新型注意模型进行图像字幕生成的方法,其主要内容包括显著度预测模型、选中图像显著区域、显著度和文本感知注意力、字幕生成、分析注意力状态。其过程为,通过新型字幕结构,在字幕生成过程中聚焦所输入图像的不同部位,具体的图像中哪些部位是显著的,哪些部位是需要结合上下文的,由显著度预测模型给定,由卷积神经网络提取图像,递归神经网络生成对应字幕,通过注意模型的扩展,在显著性预测模型中,创造两条注意力途径,一条重点关注显著区域,另一条重点关注上下文区域,两条路径在生成字幕过程中共同合作,逐步生成优秀的字幕,为图像字幕生成的创新解决方案做了进一步贡献。 | ||
搜索关键词: | 一种 基于 新型 注意 模型 进行 图像 字幕 生成 方法 | ||
【主权项】:
一种基于新型注意模型进行图像字幕生成的方法,其特征在于,主要包括显著度预测模型(一);选中图像显著区域(二);显著度和文本感知注意力(三);字幕生成(四);分析注意力状态(五)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710632600.3/,转载请声明来源钻瓜专利网。