[发明专利]利用卷积双向自注意网络解决开放长格式视频问答的方法有效
| 申请号: | 201910167951.0 | 申请日: | 2019-03-06 |
| 公开(公告)号: | CN109902164B | 公开(公告)日: | 2020-12-18 |
| 发明(设计)人: | 赵洲 | 申请(专利权)人: | 杭州一知智能科技有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/73;G06F40/30;G06F17/16 |
| 代理公司: | 无锡市汇诚永信专利代理事务所(普通合伙) 32260 | 代理人: | 王闯 |
| 地址: | 311200 浙江省杭州市萧山*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种利用卷积双向自注意网络解决开放长格式视频问答的方法,主要包括如下步骤:1)设计一种卷积双向自注意网络模型来获取开放长格式视频问答的相关答案;2)训练得到最终的卷积双向自注意网络模型,利用该模型生成长格式视频问答任务的答案。相比于一般的视频问答任务解决方案,本发明利用了卷积自注意力机制,能够更好地完成开放长格式视频问答任务。本发明在开放长格式视频问答任务中所取得的效果相比于传统的方法更好。 | ||
| 搜索关键词: | 利用 卷积 双向 注意 网络 解决 开放 格式 视频 问答 方法 | ||
【主权项】:
1.利用卷积双向自注意网络解决开放长格式视频问答的方法,其特征在于,包括如下步骤:1)设计一种堆叠卷积序列模型,利用该堆叠卷积序列模型获得帧级别的视频语义表达与单词级别的问题语义表达;2)设计一种双向问题自注意力模型,利用该双向问题自注意力模型结合步骤1)中获取的帧级别的视频语义表达与单词级别的问题语义表达,获取最终多流视频语义表达;3)设计卷积多步骤注意力解码器网络模型,利用该卷积多步骤注意力解码器网络模型结合步骤2)获取的最终多流视频语义表达,得到开放长格式视频问答的结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州一知智能科技有限公司,未经杭州一知智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910167951.0/,转载请声明来源钻瓜专利网。





