[发明专利]一种利用视频外表及动作上的渐进式优化注意力网络机制解决视频问答的方法在审
申请号: | 201711131317.9 | 申请日: | 2017-11-15 |
公开(公告)号: | CN107818174A | 公开(公告)日: | 2018-03-20 |
发明(设计)人: | 庄越挺;赵洲;吴飞 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司33200 | 代理人: | 郑海峰 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种利用视频外表及动作上的渐进式优化注意力网络机制来解决视频问答的方法。主要包括如下步骤1)针对于一组视频、问题、答案训练集,训练视频外表及动作上的渐进式优化注意力网络,学习出视频和问题的联合表达。2)对于得到的视频问题的联合表达,产生相应视频问题的答案,再与真实的相关答案一起训练出完整的网络,用来针对于视频和问题的联合表达输出对应的自然语言的答案。相比于一般的视频问答解决方案,本发明利用了视频的外表信息与动作信息,并且结合问题的单词逐渐优化其注意力值,则能够更准确地反映视频和问题的特性,并产生更加符合要求的答案。本发明在视频问答问题中所取得的效果相比于传统的方法更好。 | ||
搜索关键词: | 一种 利用 视频 外表 动作 渐进 优化 注意力 网络 机制 解决 问答 方法 | ||
【主权项】:
一种利用视频外表及动作上的渐进式优化注意力网络机制来解决视频问答的方法,其特征在于包括如下步骤:1)对于输入的视频及问题,训练出视频外表及动作上的渐进式优化注意力网络来获取问题相关的联合视频表达;2)对于步骤1)所得到的问题相关的联合视频表达,利用神经网络获得视频相关问题答案,再与真实的答案进行比较,更新整个注意力网络的参数,得到最终的视频外表及动作上的渐进式优化注意力网络;3)对于要预测答案的视频和问题,根据生成的视频外表及动作上的渐进式优化注意力网络,得到所预测的答案。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711131317.9/,转载请声明来源钻瓜专利网。