[发明专利]视觉问答模型、电子设备及存储介质在审

申请号：	201910185125.9	申请日：	2019-03-12
公开（公告）号：	CN109902166A	公开（公告）日：	2019-06-18
发明（设计）人：	黄剑辉;乔敏;黄苹苹;朱勇;吕雅娟;李盈	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06F16/332	分类号：	G06F16/332;G06F16/33;G06F16/583;G06F16/53
代理公司：	北京品源专利代理有限公司 11332	代理人：	孟金喆
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明实施例公开了一种视觉问答模型、电子设备及存储介质，其中，所述视觉问答模型包括图像编码器和文本编码器；其中，所述文本编码器用于通过对输入的问题文本的词向量序列做池化处理，以提取所述问题文本的语义表征向量；所述图像编码器用于结合所述语义表征向量提取给定图像的图像特征。本发明实施例通过使用池化方式处理文本向量，确保在视觉问答模型预测准确率损失不大的前提下，有效的提升了模型训练效率，更有益于工程上的使用。
搜索关键词：	视觉图像编码器文本编码器语义存储介质电子设备问题文本池化方式处理模型训练模型预测图像特征文本向量向量提取词向量准确率向量图像
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种视觉问答模型，其特征在于，所述视觉问答模型包括图像编码器和文本编码器；其中，所述文本编码器用于通过对输入的问题文本的词向量序列做池化处理，以提取所述问题文本的语义表征向量；所述图像编码器用于结合所述语义表征向量提取给定图像的图像特征。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司，未经北京百度网讯科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910185125.9/，转载请声明来源钻瓜专利网。

专利分类

免登录下载普通用户下载升级VIP会员，免费下载

专利文献下载